• 坚守一条红线 维护生态安全(在习近平新时代中国特色社会主义思想指引下——新时代新作为新篇章) 2019-11-12
  • 《辉煌中国》第五集《共享小康》 2019-11-12
  • 这事咋办No.2丨申请西安保障性住房必看 花生让你有房住 2019-11-11
  • 预热世界杯 玩法各异!3张竞彩红单了解一下 2019-10-18
  • 崇拜不劳而获是腐败的根源之一,正气不足是腐败的第二个根源,沉迷于初级趣味易滋生腐败,提高素质力争不想腐,以医者之心防治腐败。 2019-10-09
  • 人民日报评论员随笔:让文化热情涵养更多经典 2019-10-09
  • 国产手机跟进“刘海屏”,凸显苹果在智能手机市场的影响力 2019-10-05
  • 世界杯倒计时:球迷街头狂欢为自己的国家打Call 2019-10-02
  • 紫光阁中共中央国家机关工作委员会 2019-09-24
  • 洪崖洞客流激增 渝中开通2条应急通道12辆公交车驰援 2019-09-24
  • 中央环保督察“回头看”10省区问责630人 2019-09-19
  • 天津举办改善营商环境专题讲座 2019-09-19
  • 日本核能行业誓言日本将在今年内重新启用核电 2019-09-03
  • 中国保险行业协会发布汽车后市场配件合车标准 2019-09-02
  • 晋中市通报五起违反中央八项规定精神问题 2019-08-30
  • 当前位置 > CPDA数据分析师 > “数”业专攻 > R语言中的机器学习包

    天津福利彩票快乐十分走势图:R语言中的机器学习包

    浙江快乐彩和值走势图 www.pn-vs.com 来源:数据分析师 CPDA | 时间:2015-07-28 | 作者:admin

    机器学习是计算机科学和统计学的边缘交叉领域,R关于机器学习的包主要包括以下几个方面:
    1)神经网络(Neural Networks):
    nnet包执行单隐层前馈神经网络,nnet是VR包的一部分(//cran.r-project.org/web/packages/VR/index.html)。
    2)递归拆分(Recursive Partitioning):
    递归拆分利用树形结构模型,来做回归、分类和生存分析,主要在rpart包(//cran.r-project.org/web/packages/rpart/index.html)和tree包(//cran.r-project.org/web/packages/tree/index.html)里执行,尤其推荐rpart包。Weka里也有这样的递归拆分法,如:J4.8, C4.5, M5,包Rweka提供了R与Weka的函数的接口(//cran.r-project.org/web/packages/RWeka/index.html)。
    party包提供两类递归拆分算法,能做到无偏的变量选择和停止标准:函数ctree()用非参条件推断法检测自变量和因变量的关系;而函数mob()能用来建立参数模型(//cran.r-project.org/web/packages/party/index.html)。另外,party包里也提供二分支树和节点分布的可视化展示。
    mvpart包是rpart的改进包,处理多元因变量的问题(//cran.r-project.org/web/packages/mvpart/index.html)。rpart.permutation包用置换法(permutation)评估树的有效性(//cran.r-project.org/web/packages/rpart.permutation/index.html)。knnTree包建立一个分类树,每个叶子节点是一个knn分类器(//cran.r-project.org/web/packages/knnTree/index.html)。LogicReg包做逻辑回归分析,针对大多数自变量是二元变量的情况(//cran.r-project.org/web/packages/LogicReg/index.html)。maptree包(//cran.r-project.org/web/packages/maptree/index.html)和pinktoe包(//cran.r-project.org/web/packages/pinktoe/index.html)提供树结构的可视化函数。
    3)随机森林(Random Forests):
    randomForest 包提供了用随机森林做回归和分类的函数(//cran.r-project.org/web/packages/randomForest/index.html)。ipred包用bagging的思想做回归,分类和生存分析,组合多个模型(//cran.r-project.org/web/packages/ipred/index.html)。party包也提供了基于条件推断树的随机森林法(//cran.r-project.org/web/packages/party/index.html)。varSelRF包用随机森林法做变量选择(//cran.r-project.org/web/packages/varSelRF/index.html)。
    4)Regularized and Shrinkage Methods:
    lasso2包(//cran.r-project.org/web/packages/lasso2/index.html)和lars包(//cran.r-project.org/web/packages/lars/index.html)可以执行参数受到某些限制的回归模型。elasticnet包可计算所有的收缩参数(//cran.r-project.org/web/packages/elasticnet/index.html)。glmpath包可以得到广义线性模型和COX模型的L1 regularization path(//cran.r-project.org/web/packages/glmpath/index.html)。penalized包执行lasso (L1) 和ridge (L2)惩罚回归模型(penalized regression models)(//cran.r-project.org/web/packages/penalized/index.html)。pamr包执行缩小重心分类法(shrunken centroids classifier)(//cran.r-project.org/web/packages/pamr/index.html)。earth包可做多元自适应样条回归(multivariate adaptive regression splines)(//cran.r-project.org/web/packages/earth/index.html)。
    5)Boosting :
    gbm包(//cran.r-project.org/web/packages/gbm/index.html)和boost包(//cran.r-project.org/web/packages/boost/index.html)执行多种多样的梯度boosting算法,gbm包做基于树的梯度下降boosting,boost包包括LogitBoost和L2Boost。GAMMoost包提供基于boosting的广义相加模型(generalized additive models)的程序(//cran.r-project.org/web/packages/GAMMoost/index.html)。mboost包做基于模型的boosting(//cran.r-project.org/web/packages/mboost/index.html)。
    6)支持向量机(Support Vector Machines):
    e1071包的svm()函数提供R和LIBSVM的接口 (//cran.r-project.org/web/packages/e1071/index.html)。kernlab包为基于核函数的学习方法提供了一个灵活的框架,包括SVM、RVM……(//cran.r-project.org/web/packages/kernlab/index.html) 。klaR 包提供了R和SVMlight的接口(//cran.r-project.org/web/packages/klaR/index.html)。
    7)贝叶斯方法(Bayesian Methods):
    BayesTree包执行Bayesian Additive Regression Trees (BART)算法(//cran.r-project.org/web/packages/BayesTree/index.html,//www-stat.wharton.upenn.edu/~edgeorge/Research_papers/BART%206--06.pdf)。tgp包做Bayesian半参数非线性回归(Bayesian nonstationary, semiparametric nonlinear regression)(//cran.r-project.org/web/packages/tgp/index.html)。
    8)基于遗传算法的最优化(Optimization using Genetic Algorithms):
    gafit包(//cran.r-project.org/web/packages/gafit/index.html)和rgenoud包(//cran.r-project.org/web/packages/rgenoud/index.html)提供基于遗传算法的最优化程序。
    9)关联规则(Association Rules):
    arules包提供了有效处理稀疏二元数据的数据结构,而且提供函数执Apriori和Eclat算法挖掘频繁项集、最大频繁项集、闭频繁项集和关联规则(//cran.r-project.org/web/packages/arules/index.html)。
    10)模型选择和确认(Model selection and validation):
    e1071包的tune()函数在指定的范围内选取合适的参数(//cran.r-project.org/web/packages/e1071/index.html)。ipred包的errorest()函数用重抽样的方法(交叉验证,bootstrap)估计分类错误率(//cran.r-project.org/web/packages/ipred/index.html)。svmpath包里的函数可用来选取支持向量机的cost参数C(//cran.r-project.org/web/packages/svmpath/index.html)。ROCR包提供了可视化分类器执行效果的函数,如画ROC曲线(//cran.r-project.org/web/packages/ROCR/index.html)。caret包供了各种建立预测模型的函数,包括参数选择和重要性量度(//cran.r-project.org/web/packages/caret/index.html)。caretLSF包(//cran.r-project.org/web/packages/caretLSF/index.html)和caretNWS(//cran.r-project.org/web/packages/caretNWS/index.html)包提供了与caret包类似的功能。
    11)统计学习基础(Elements of Statistical Learning):
    书《The Elements of Statistical Learning: Data Mining, Inference, and Prediction 》(//www-stat.stanford.edu/~tibs/ElemStatLearn/)里的数据集、函数、例子都被打包放在ElemStatLearn包里(//cran.r-project.org/web/packages/ElemStatLearn/index.html)。

  • 坚守一条红线 维护生态安全(在习近平新时代中国特色社会主义思想指引下——新时代新作为新篇章) 2019-11-12
  • 《辉煌中国》第五集《共享小康》 2019-11-12
  • 这事咋办No.2丨申请西安保障性住房必看 花生让你有房住 2019-11-11
  • 预热世界杯 玩法各异!3张竞彩红单了解一下 2019-10-18
  • 崇拜不劳而获是腐败的根源之一,正气不足是腐败的第二个根源,沉迷于初级趣味易滋生腐败,提高素质力争不想腐,以医者之心防治腐败。 2019-10-09
  • 人民日报评论员随笔:让文化热情涵养更多经典 2019-10-09
  • 国产手机跟进“刘海屏”,凸显苹果在智能手机市场的影响力 2019-10-05
  • 世界杯倒计时:球迷街头狂欢为自己的国家打Call 2019-10-02
  • 紫光阁中共中央国家机关工作委员会 2019-09-24
  • 洪崖洞客流激增 渝中开通2条应急通道12辆公交车驰援 2019-09-24
  • 中央环保督察“回头看”10省区问责630人 2019-09-19
  • 天津举办改善营商环境专题讲座 2019-09-19
  • 日本核能行业誓言日本将在今年内重新启用核电 2019-09-03
  • 中国保险行业协会发布汽车后市场配件合车标准 2019-09-02
  • 晋中市通报五起违反中央八项规定精神问题 2019-08-30
  • 11选5每期必中 吉林11选5走势图 江苏快三开奖结果∵ 贵州十一选五开奖结果 95期开奖号码是多少 新时时彩开奖方法如下 香港赛马会网 快速时时走势图 时时彩计划app软件 白姐公开一码 七星彩历史数据 双色球蓝号走势图 手机足球比分 大乐透近(100)走势图 打麻将必胜绝技顺口溜