炼数成金 商业智能机器学习
订阅

机器学习

谷歌用ML模型替代数据库组件,或彻底改变数据系统开发
谷歌用ML模型替代数据库组件,或彻底改变数据系统开发
“如果这项研究取得更多的成果,将来有一天我们很可能回过头看然后说,索引是最先倒下的,接着是其他的数据库组件(排序算法、查询优化、连接),它们都逐渐被神经网络取代。”纽约州立大学布法罗分校的计算机科学和 ...
2018 AI趋势:AI芯片更丰富,用机器学习的企业翻倍
2018 AI趋势:AI芯片更丰富,用机器学习的企业翻倍
这是一个急速变化但又有很强发展衔接性的时代。强大的运算力对训练和推理神经网络来说必不可少。2009年,第一块GPU问世,这种专门为密集型计算、高度并行计算设计的芯片,比CPU更能满足机器学习任务的要求。自此,越 ...
Jeff Dean出品:用机器学习索引替代B-Trees,3倍性能提升
Jeff Dean出品:用机器学习索引替代B-Trees,3倍性能提升
数据库最开始是统一的,一刀切的“黑箱”问题。随着时间的推移,这一观点细化到了“标准尺寸”的 OLAP数据库和 OLTP数据库。数据库使用索引来快速访问数据。B-tree和哈希映射是常用的实现索引的技术。但从“黑箱”的 ...
基于Docker的机器学习--Tensorflow-GPU环境
基于Docker的机器学习--Tensorflow-GPU环境
基于 NVIDIA-Docker 的 CPU 环境中,GPU是可以复用的,可以将1个GPU挂载到多个 docker 容器中使用提高了GPU的使用效率,这是 KVM 虚拟机通过硬件透传无法实现的。由于多个容器共享一个GPU,不能做到对 GPU 资源进行 ...
Andrej Karpathy:神经网络是软件2.0,而非机器学习的一种工具
Andrej Karpathy:神经网络是软件2.0,而非机器学习的一种工具
我有时看到人们把神经网络称为“机器学习工具箱中的另一种工具”。神经网络作为一种工具有这样那样的优点和缺点,在这个任务或那个任务工作,有时你可以利用它们赢得Kaggle的比赛。不幸的是,这种解释只见树木,不见 ...
为什么XGBoost在机器学习竞赛中表现如此卓越?
为什么XGBoost在机器学习竞赛中表现如此卓越?
机器学习算法的目标是减少预期的泛化误差,这也被称为风险(risk)。如果我们知道真实的分布 P(x,y),那么风险的最小化就是一个可以通过优化算法解决的最优化任务。但是,我们并不知道真实分布,只是有一个用于训练 ...
呼之欲出的量子计算机,和它漫长的最后一英里
呼之欲出的量子计算机,和它漫长的最后一英里
图:中国科学院院士、量子计算专家、图灵奖获得者姚期智11月4日,中国科学院院士、量子计算专家、图灵奖获得者姚期智在腾讯WE大会的五周年论坛上远程发布了最新演讲。姚期智用RSA的密码系统作例子说明了量子计算机的 ...
数据缺失的坑,无监督学习这样帮你补了
数据缺失的坑,无监督学习这样帮你补了
无监督学习(UL)有很多没开发的潜力。它是一门从“未标记”数据中推导一个函数来描述其隐藏结构的艺术。但首先,从数据中找到其结构是什么意思呢? 让我们来看以下两个例子:Blobs气泡状分布:这个简单。任何人看到 ...
AUC越大,正确率就越高?
AUC越大,正确率就越高?
近日,一位朋友拿着两个模型预测效果比较的结果来咨询,当然是遇到了一个好像不太正常的现象才来咨询的。两个模型都是二分类结局的,应用常见的Logistic回归模型得到结果如下:模型A的正确率为85%,AUC为0.98;模型B ...
机器学习之确定最佳聚类数目的10种方法
机器学习之确定最佳聚类数目的10种方法
在聚类分析的时候确定最佳聚类数目是一个很重要的问题,比如kmeans函数就要你提供聚类数目这个参数,总不能两眼一抹黑乱填一个吧。之前也被这个问题困扰过,看了很多博客,大多泛泛带过。今天把看到的这么多方法进行 ...
适合入门的8个趣味机器学习项目
适合入门的8个趣味机器学习项目
谈到机器学习,相信很多除学者都是通过斯坦福大学吴恩达老师的公开课《Machine Learning》开始具体的接触机器学习这个领域,但是学完之后又不知道自己的掌握情况,缺少一些实际的项目操作。对于机器学习的相关竞赛挑 ...
亚马逊CTO:机器学习的进步是如何推动企业发展的
亚马逊CTO:机器学习的进步是如何推动企业发展的
Vogels博士认为往往在事情发生以后我们才能明确是否科技进步了,但是人工智能和机器学习这两项技术有点不同。机器学习作为AI(人工智能)的一部分,对于大规模数据从规则和认知模型上进行描述,完成针对未来数据的预 ...
DARPA再出新招:射频频谱+机器学习=射频学习?
DARPA再出新招:射频频谱+机器学习=射频学习?
近日,美国国防高级研究计划局(Defense Advanced Research Projects Agency, DARPA)推出新项目:运用机器学习技术识别数以亿计不同的无线电讯号。如今人们的生活中,应用射频的电子设备无处不见,数以亿计的移动电 ...
千锤万凿出深山:且谈特征工程最佳实践
千锤万凿出深山:且谈特征工程最佳实践
作为为机器学习创建新特征的实现过程,特征工程已经成为改进预测模型的最具实效的方法之一。获取特征难度极高、相当耗时且要求具备专业知识。“应用机器学习”在本质上其实就是在实现特征工程。通过特征工程方法,你 ...
大规模机器学习的编程技术、计算模型以及Xgboost和MXNet案例
大规模机器学习的编程技术、计算模型以及Xgboost和MXNet案例
大家好,很高兴和大家一起分享大规模机器学习相关的知识,希望大家能有所收获。现在,机器学习的趋势从传统方法中的简单模型 + 少量数据(人工标注样本),到简单模型 + 海量数据(比如基于逻辑回归的广告点击率预测 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

      GMT+8, 2017-12-16 00:10 , Processed in 0.096006 second(s), 16 queries .