数据集和算法哪个先出现?
数据集和算法哪个先出现?

Array Ventures 的 Shruti Gandhi 最近在 T2 的播客中与 Crowdflower 的 Lukas Biewald 讨论了他对机器学习的想法。Lukas 建议人们接受以下认识:
1。你需要大量的数据
与过去不同,现代机器学习能够梳理成吨成吨的训练数据。数据越多,机器学习算法越好。算法越好,产品才能越好。例如,美国政府花费数十亿美元试图建立一个全面的翻译服务平台。谷歌通过利用尽可能多的数据抢先了一步。尽管谷歌翻译只是该公司的一个副业项目,但他们可以对数百万个国际网站进行数据抓取,以帮助算法更好地学习。
2。公司必须对期望持现实态度
大多数人认为计算机程序不会出错。问题是它们确实如此——尤其是在人工智能领域。最好的人工智能解决方案有 80-82%的准确率。但是,如果机器学习程序在大约 20%的情况下出错,许多高管就会质疑这个价值主张。这是可以理解的,因为错误会带来巨大的代价。因此,在人工智能无法处理这些情况的 20%时间里,仍然需要一个人在循环中。
3。人工智能的发展才刚刚起步
然而,机器学习的质量正在上升。仅仅在过去的五年里,机器学习已经有了显著的进步。
在他的最新文章,中,人工智能的记者戴夫·格什格恩说,在 2012 年,“谷歌的神经网络[……]教会了自己检测猫和人类的形状,准确率超过 70%。这比当时任何其他机器学习都提高了 70%。”今天,人工智能更加先进。Gershgorn 继续说,“人工智能研究在过去五年中比过去 50 年取得了更大的进展,部分原因是有更多的数据可用于训练人工智能。这种进步很大程度上可以在谷歌、亚马逊和脸书的产品中看到:你的照片可以被自动标记,你的电子邮件应用程序知道你喜欢如何回复电子邮件,或者新的智能扬声器可以使用人工智能来识别你在说什么。”
同样,数据越多,算法就越好。
然而,卢卡斯认为期望应该是有限的。要让人工智能算法 100%正确是极其困难的,如果不是不可能的话。但是梦想总是有帮助的,可能性每天都在增加。
还想要更多吗?点击 查看整个播客 。订阅【Array】播客从其他成功的创始人那里学习一系列技巧和技能。
Shruti Gandhi是Array Ventures的管理合伙人。Array Ventures 是一家风险投资公司,专注于投资创始人创建利用数据、人工智能和新行为为大型市场创建新平台的公司。



