crespo09 发表于 2017-3-2 12:35:07

机器学习------精心总结

1.数学

[*]偏差与方差
[*]拉格朗日
[*]核函数
[*]凸优化
[*]协方差矩阵
[*]Hessian矩阵
[*]CDF(累计分布函数)
[*]高斯概率密度函数
[*]中心极限定理
2.机器学习
  Java 机器学习 工具 & 库
  1.处理小数据效果好
2.深度学习—大数据,超过500w;图像,语言方面效果奇好

[*]  SVD
[*]  最小二乘法
[*]梯度下降法
[*]  局部加权回归
  1.最大似然估计
2.logistic回归
3.感知器的初步—logistic的简化情节

[*]  牛顿法
  1.介绍了牛顿方法
2.广义线性模型
3.多项式分布,softmax回归

[*]  高斯判别分析
  1.高斯判别
2.朴素贝叶斯

[*]  EM
[*]隐马尔可夫模型
[*]决策树向量机
  决策树算法介绍及应用


[*]K近邻
[*]支持向量机
[*]PageRank
[*]强化学习
[*]LDA
[*]PCA
[*]pLSA
[*]LSI
[*]ICA
[*]最大熵模型
[*]条件随机场
[*]最大熵隐马尔可夫模型
[*]Gradient Boosting
[*]K-Means
[*]贝叶斯逻辑斯蒂克回归
[*]关联规则挖掘
[*]随机森林
3.信息论

[*]压缩率很高的数据结构
[*]信息熵与信息增益
[*]数据压缩原理
[*]香农游戏
[*]二维码原理
4.深度学习
  机器学习的一个分支
各种编程语言的深度学习库整理
深度学习如何入门(知乎)
Elephas:Apache Spark上的Keras深度学习框架

[*]感知器
[*]反向传播算法
[*]自动编码器
[*]栈式自编码器
[*]微调多层自编码算法
[*]深度信息网络
[*]softmax回归
[*]白化
[*]池化
[*]受限玻尔兹曼机
[*]稀疏编码
[*]递归神经网络
[*]卷积神经网络—图像识别,语音识别,,.
[*]前馈神经网络
5.全文检索

[*]搜索建索引过程
[*]搜索评分过程
[*]搜索查询分析器
[*]Rocchio相关反馈算法
[*]向量空间模型
[*]BM25基于概率的搜索评分
[*]Lucene源码分析
[*]solrcloud
[*]Solr空间搜索原理
[*]GeoHash算法
[*]地理空间距离计算原理
[*]WAND检索算法
[*]智能化信息检索模型
[*]Kullback-Leibler距离/相关熵
[*]交叉熵
6.计算广告

[*]正文广告
[*]上下文广告
[*]显示广告
[*]合约广告
[*]竞价广告
[*]搜索广告
[*]受众定向
[*]竞价广告的定价机制
[*]eCPM估计
[*]广义第二高价
[*]精准人群定向
[*]实时竞价
[*]广告交易平台
[*]需求方平台(DSP)程序购买
[*]广告有效性原理
[*]二部图匹配算法
[*]HWM算法
[*]点击流挖掘
[*]广告系统的一些商业模式
[*]实时反作弊
[*]CTR点击预测
[*]架构
7.自然语言处理

[*]NLTK

[*]N-gram语言模型
[*]词共现/TFIDF
[*]噪声信道模型
[*]统计分类模型
[*]语义相关性
[*]基于HMM的词性标注
[*]统计语言模型的评价方法
[*]扩充转移网络
[*]动态规划算法
[*]最小编辑距离
[*]浅层句法分析技术
[*]知识库的构建
[*]命名实体识别
[*]未登陆词识别
[*]语言模型结构设计
[*]树邻近语法
[*]文本建模
[*]随机上下文无关文法
[*]概率上下文文法
[*]同义词自动构建(词共现,基于浅层语法分析)
[*]文本分类技术
8.架构

[*]OOP
[*]聊天系统/实时高效信息系统架构与源码
[*]Bloom Filter 过滤器
[*]分布式时钟(逻辑时钟) 同步技术
[*]SCALA
[*]Netty
[*]Jetty
[*]一致性Hash
[*]分布式基本组建
[*]原子广播
9.爬虫

[*]爬虫原理
[*]分布式架构
[*]通用爬虫
[*]主题爬虫
[*]Nutch
[*]Xpath
[*]网页去重
[*]URL去重
10.应用

[*]人脸识别
[*]垃圾邮件分类
[*]文本聚类
[*]语音合成(分解)
[*]语音识别
[*]手写识别
[*]推荐系统
[*]文档主题分析
[*]二进制权限系统
[*]搜索引擎关键字智能提示
[*]最小敏感局部hash算法
[*]Simrank
[*]手写输入法
[*]为文本生成关键词和摘要
[*]拼音缩写提取
[*]汉字转拼音/拼音转汉字
[*]机器翻译
[*]自动提取标签
[*]图片提取标题
[*]文字生成图像
[*]问答系统

11.Github中的开源项目
  值得mark的11个开源机器学习项目
  1.scikit-learn Github:scikit-learn
2.Shogun
Github:shogun
3.Accord Framework/AForge.net
Github:Accord Framework/AForge.net
4.Mahout
5.MLlib
6.H2O
Github:H2O
7.Cloudera Oryx
8.GoLearn
9.Weka
10.CUDA-convnet
11.ConvNetJS
Github:ConvNetJS
12.个人收集网址

[*]Microsoft Research
[*]机器学习温和指南
[*]从零实现来理解机器学习算法:书籍推荐及障碍的克服
[*]伯乐在线—机器学习
[*]Coursera
[*]台湾机器学习课程
[*]机器学习之开源库大总结
[*]推荐!国外程序员整理的机器学习资源大全
[*]机器学习经典书籍
[*]机器学习经典论文/survey合集
[*]人工智能和机器学习领域有哪些有趣的开源项目
[*]机器学习该怎么入门(知乎回答)
[*]整理:深度学习 vs 机器学习 vs 模式识别
13.机器学习需要了解的人物
  1.吴恩达
2.中国大牛组

[*]周志华
个人主页
[*]杨强
个人主页
[*]李建中 —分布式数据库
[*]唐杰 —图挖掘
个人主页
[*]张钹
[*]刘铁岩
个人主页
[*]王海峰 —信息检索,NPL,机器翻译
个人主页
[*]何晓飞 — 多媒体处理,图像检索,流型学习
个人主页
[*]朱军
[*]吴军
个人主页
[*]张栋
个人主页
[*]戴文渊
个人主页
[*]李航—华为诺亚方舟实验室
华为诺亚方舟实验室
  《中国大牛组》资源来源于小木虫
小木虫
14.会议论文收集
15.书籍
  1.PRML—Pattern Recognition And Machine Learning
豆瓣
页: [1]
查看完整版本: 机器学习------精心总结