无需人类经验的机器学习 会不会带来材料科研新方法?


2016年李世石对战Alphago,是当时机器学习最吸引眼球的大事件。开赛前,很多人认为alphago不可能赢。因为围棋超过10的170次方种变化,只有人类这么聪明的大脑才能驾驭。结果李世石和柯洁的两次挑战纷纷败北,世上再无人敢说能战胜AlphaGo。

胜负不是关键,文章在背后。跟李世石、柯洁下棋的AlphaGo主要是采用监督学习。AlphaGo首先是拜人类为师,学习了3000万步人类棋谱,对六段以上职业棋手走棋规律进行模仿。但是,人的经验毕竟是有局限的。如果让机器人不受先入为主的经验影响,会怎么样呢?

所以全新的AlphaGo则采用了无监督学习。让两台机器在遵守规则的前提下随机走棋,日夜切磋,总结经验,不断批评和自我批评。结果,机器不但自己摸索出开局、收官、定式等以前人类已知的围棋知识,也摸索出了新的定势。

据介绍,全新的 AlphaGo zero 3天超过打败李世石的AlphaGO Lee,21天超过打败柯洁的AlphaGo Master,自学 40天之后就超过了所有其他的AlphaGo版本。仅凭两台机器自我对弈中学习和进化,进化速度远超人类,实现对人类的碾压,发展出一套截然不同的下棋方法,并且更加接近完美的状态。

而就在最近,马斯克和Sam Altman所创立的人工智能非营利组织OpenAI宣布:其开发的AI能够组队在5V5对战中战胜Dota2顶尖业余玩家。跟围棋不一样的地方在于,Dota2需要大量的实时决策以及队友之间的团队默契。5位AI玩家之间的胜利,证明了人工智之间能够相互配合。

同样的,此次的OpenAI 5vs5 和之前的1vs1版本全部从随机参数开始,并不从人类玩家的历史策略方法中进行搜索或者自举。据介绍,这些AI机器人经过大量的训练之后,每天积累的经验是一个人一生积累经验的100倍。

如果让机器也从零开始,自主摸索、学习,在材料&化学领域又会是什么样子?斯坦福张首晟团队开发的人工智能程序Atom2Vec就用几小时重构了人类用了上百年才发现的元素周期表。

Atom2Vec首先通过分析在线数据库的化合物名称列表,学会区分不同的原子。然后,借用自然语言处理中的简单概念:一个词语的特性是可以从它周围出现的其他单词来得出的;把化学元素根据它们所处的化学环境聚类。

同前述两个例子一样,Atom2Vec采用的也是无监督学习。也就是说,Atom2Vec没有借鉴人类经验,独立重新发现了元素周期表。

元素周期表已经发现了,Atom2Vec重新发现又有什么用呢?它的意义在于AI是可以独立重复人类已经完成的一些伟大发现。进一步,如果将来AI独立发现了人类所没有发现的规模或者新材料,大家也不会感到奇怪。

当前,材料科学研究被自嘲为“炒菜”,味道淡了加盐,咸了加水,通过不断的试错来发现新材料。而通过机器学习、高通量计算,材料科学家们可以加快试错的效率,节省人工,进而猜测合成新材料的方式。 不过,这都是基于材料科学家以往的各种数据、理论。假如,人工智能通过无监督学习,自我探索,自己摸索出一些新材料,会不会是另一番新天地?

本文由雨桐供稿,材料人编辑整理。

分享到