王岩华
作者: 刘畅 (导师:王岩华)
学位名称: 硕士
出处: 北京理工大学数学与统计学院 2016
关键词: 变量选择;变量分组;弹性网;逻辑回归
摘要: 经典逻辑回归使用最大似然方法来估计模型,在面对p?9)的高维问题时,计算方法失灵。为了得到可解释的精确模型,必须提出能够有效选择重要影响变量的方法。在一些工程和科学应用中,预测变量存在分组情况。现有方法可以根据变量已知的分组情况进行变量选择,在剔除不重要变量的同时,对重要变量的影响进行估计,取得了较 ...
作者: 李鹏鹏 (导师:王岩华)
学位名称: 硕士
出处: 北京理工大学数学与统计学院 2016
关键词: 工业;行业毛利率;趋势预测;影响因素
摘要: 工业是国民经济发展的支柱,其发展状况和收益水平关系到社会经济运行和人民生活质量。毛利率作为评价收益的重要指标,不仅反映了企业的盈利能力,更体现了行业整体的收益空间,更加准确地反映出工业行业的整体收益状况。本文将毛利率作为分析我国工业行业收益水平的切入点,运用时间序列建模方法、主成分分析和多元线性回归 ...
作者: 李保义 (导师:王岩华)
学位名称: 硕士
出处: 北京理工大学数学与统计学院 2015
关键词: 客户分类;聚类分析;K-means算法;两步聚类;Kohonen网络
摘要: 随着互联网产业的迅猛发展,互联网企业间竞争逐渐加剧;企业竞争的实质就是对客户资源的竞争,这意味着能够有效开发与保持客户的企业往往更加具有竞争优势。然而,企业资源是有限的,难以同时满足所有客户的需求;为保障收益最大化,企业需要将资源尽可能多地分配到对企业贡献最大的客户群体上。因此,企业需要对客户进行分 ...
作者: 李偲 (导师:王岩华)
学位名称: 硕士
出处: 北京理工大学数学与统计学院 2015
关键词: 文本分类;朴素贝叶斯;分类器;特征提取
摘要: 现在新浪微博的注册用户达到10亿以上,微博数据有着非常巨大的潜在价值,但是目前对这些大量的数据并没有进行管理分类,整体上还是比较杂乱的,很多有用信息都需要我们进行挖掘,本文通过朴素贝叶斯分类方法对微博数据进行分类,数据处理的结果应该会有很大的商业价值。本文主要做的工作从宏观上来讲就是进行文本分类,从 ...
作者: 张静 (导师:王岩华)
学位名称: 硕士
出处: 北京理工大学数学与统计学院 2015
关键词: 客户流失;预测;SAS;逻辑回归
摘要: 客户流失是互联网时代中大型公司所面临的一大难题,研究证明,从一位老客户中得到的收益要大于一位新用户。同时,吸引一位新用户的成本要比挽留一位即将流失的老客户多得多,因此建立流失预测模型具有重要的意义。本文首先会介绍所需的建模用户数据的筛选以及各个变量的定义。再对变量进行分析,以初步筛选做为建模的X变量 ...
作者: 段翠婷 (导师:王岩华)
学位名称: 硕士
出处: 北京理工大学数学与统计学院 2015
关键词: 变量选择;惩罚最小二乘方法;惩罚似然方法;加权Lasso;筛选扫描法
摘要: 高维数据下的变量选择是近年来统计学术界的热点。对于高维数据,惩罚方法是一种在科研和实践中都非常有效的变量选择方法。传统的变量选择方法在 比较大的情况下,面临着计算上的NP-hard等问题。惩罚方法的出现不仅解决了计算上的困难,而且对于p>n和p>>n的数据都能够做出正确的变量选择和有效的参数估计。本 ...
作者: 郭翔凯 (导师:王岩华)
学位名称: 硕士
出处: 北京理工大学数学与统计学院 2015
关键词: 房产网站;多元统计;聚类分析;因子分析;判别分析
摘要: 如今,互联网的大量渗透已悄然改变了人们的消费习惯,在房产领域,网络已经成为购房者的重要信息来源和决策依据。凭借着进入房地产互联网领域,许多房产企业发展迅速,并逐渐开始壮大,与此同时也有一些企业因各种原因,发展缓慢而退出房产网站市场,因此,利用数据分析来考虑房产类网站对企业的影响,具有一定的现实意义。 ...
作者: 史书睿 (导师:王岩华)
学位名称: 硕士
出处: 北京理工大学理学院 2014
关键词: LASSO回归;五折交叉验证;预报误差平方和;商品房销售额;居民消费价格指数
摘要: 大维数据的处理在统计分析工作中是十分重要的问题,但经典的多元统计方法如逐步回归,岭回归,主成分回归等在处理大维数据方面存在着不足之处。Robert Tibshirani(1996)提出了一种被称为LASSO的方法,经研究发现这个方法在处理大维数据方面比传统方法更有优势。Efron等(2004)提出了 ...
作者: 李玉环 (导师:王岩华)
学位名称: 硕士
出处: 北京理工大学
作者: 孙静茹 (导师:王岩华)
学位名称: 硕士
出处: 北京理工大学