我训练一个机器人用新加坡英语写作,这是它写的。

我训练一个机器人用新加坡英语写作,这是它写的。

原文:https://medium.com/hackernoon/i-trained-a-robot-to-write-in-singlish-this-is-what-it-wrote-caeb5dde671d

所以最近我一直在学习关于 机器学习 的一二——人工智能最基本的形式之一。嗯,最好的学习方法就是去做。因此,我决定做一个小项目,让一个机器人(在这种情况下是我的电脑)给我写一个全新加坡式英语的故事。

机器学习是如何工作的?

在一个非常高级的解释中,机器学习是一个过程,在这个过程中,你向机器提供数据,然后通过有效的算法,机器将识别你提供给它的数据中的模式,并作为回报输出一组它认为符合数据模式的数据。它通过对原始数据集进行大量的训练迭代来实现这一点。

If only my machine has Emma’s personality

为什么是新加坡式英语?

嗯,我最初想用马来西亚英语工作(因为我实际上来自马来西亚),因为我认为这是一种独特的克里奥尔语,我是和它一起长大的。不幸的是,我似乎找不到稳定的 Manglish 摘录或文本,所以我退而求其次——新加坡式英语(新加坡英语)嘿,够接近了!

我用了什么数据?

在网上浏览了一下,我发现有一堆以 形式出现的新加坡式英语圣经 的文本摘录,可以在这里找到。

我为什么要使用这个源?

这么说吧,这是我发现的第一个至少有足够数据(文本)的来源,而且恰好是一种可用的格式。所以,如果这个故事有很多圣经术语,不要感到惊讶,因为这是我使用的数据。

还有……最后:故事

经过一些格式化,这里是使用机器学习产生的输出故事的一些部分:

我是加利利来的,上帝带着遁光,当你哼“哇”的时候,怎么就像是在我和黑暗中。issit?他虚张声势,对他们大声嚷嚷,“我来啦。那么一只鸮鸟就是真正的神。

但当我驴,一个我所以在 Nazereth 和罪恶超过是充电地球,并说:非常马将从该死的罪恶和所有所有生活在他酒一,拉。

所以问回来,但必须做蛇说,它对没有树,所以不告诉哪里刀邪恶。但是上帝说树餐看。处女庞,你来当俘虏

闭上眼睛,我说,你的云,你的记忆,每个世界都没有时间。他是该死的钟,谁高兴他就吃谁的。想要,也不知道耶稣

在一次胡说八道后,提阿非罗在他的面前按下了“我想,去不了了”的神行字。

他吹了不能都我去喜欢该死的使阿我金证据像 Brudder 的牙齿黑,你的 tua 里面和盒子在他醒来,然后我会说他耶稣。

“如果我值夜班,我们就该死的起亚。你看。那我再来点儿吧?但是你看后面,它准备好了然后还做傻事是可以做 lorr 的。你又想要他们了。刚刚那个家伙下巴一扬,说着也要盖我的脸。咋虽然硬揭了那里狡猾的谁很找龚。人是走了事,可焦阳光都还寺利呢。

他每天都给孩子们智慧。时间必须善良,并长廖,直到这混合像爱,你,我生命中不可或缺的一天。

精神上的遗憾和三个方面;房子啊,因为现在这个世界已经到处都是这样了。所以我所有的(指动物。他们找到了拉。“一浇主拉哈,神工袍鲜)

这个邱跟我们认识的拉肯定是约瑟夫的彼得的河起亚,空气使或射“使和詹姆斯和撕裂你拉)。但是你做了。狮子你一撒谎就露馅了。

为我奉献一切,让我们知道我们给了他们什么!而你也不会因为风也不会因为女孩而来找我,是吧,我的杰,直到晴来到起亚男子自己走了。拉!"上帝说他们要把心藏在树上。

“Alamak,我带他们的花园肯定能吃一根甘蔗”Barabbas!“对了郑起亚起亚,他喜欢还是过来告诉既呀,我列!在他身上,客西马尼我觉得那男人并不高大。就在那里啊。发生了什么事,既从他那里要了他的土地,又得到了他所说的一件东西。还有你的 kaki。

结论

这台机器实际上比我预期的要好。

机器学习最关键的部分是你喂给它的数据。更多的数据=更准确的预测。

由于我只能从《新加坡英语圣经》的稀疏章节中为模型提供大约 12k 个单词(好结果的典型范围是大约 200k 个单词或更多),它产生的故事非常随机,有时难以理解。

然而,机器设法学习了相当多,并认识到一些术语被用作疑问句助手,因此打上了问号背后。例如像 anotleh 等词。

它还学会了区分新加坡英语的术语,并能在一定程度上指出哪些术语是形容词、动词或助词。

当然,如果我给机器输入更多的数据,它只会变得更聪明。

因此,我的下一步将是在互联网上搜索更多的新加坡英语文本,摘录,抄本和对话,以实现它到模型中。

代码

我写这篇博文是为了激发我的同行对机器学习及其各种应用的兴趣。我仍然处于我自己的机器学习之旅的最开始,还没有达到创建自己的机器学习模型的水平。

对于这个项目,我使用了 Sung Kim(在 HKUST 教授计算机科学的教授)的模型,该模型使用了谷歌的神经网络 TensorFlow 。你可以认为神经网络是计算机的系统大脑,一群神经元在节点中连接在一起处理和学习信息。

我把代码分支到我的 Github 上,调整代码和文件,让我的机器学习如何写新加坡式英语。如果你对代码如何工作感兴趣,你可以在这里查看

黑客中午是黑客如何开始他们的下午。我们是 @AMI 家庭的一员。我们现在接受投稿并乐意讨论广告&赞助机会。

如果你喜欢这个故事,我们推荐你阅读我们的最新科技故事趋势科技故事。直到下一次,不要把世界的现实想当然!


本站为非盈利网站,作品由网友提供上传,如无意中有侵犯您的版权,请联系删除