现在的 AI 不止会写新闻,还会写书了。 学术出版商 Springer Nature 出版了第一本由机器学习生成的书籍——《锂离子电池:机器生成的当前研究摘要》,它概述了锂离子电池领域的最新研究成果。 1 b2 `7 S; U+ `* j. ?, Y* h; V
& P3 F0 E7 R2 M: I
AI 是如何写出一本书的? 这里面用到的技术,是一种由 Springer Nature 和法拉克福歌德大学共同开发的一种先进算法:Beta Writer。 % ~- T5 X8 o& ~* [/ m: k
它使用的是基于相似性的聚类分析,将海量的源文档排列成连贯的章节,然后创建文章的简洁摘要,同时,将文章内部加入超链接,这样利于读者进一步阅读原始的文章。 而 AI 这种创新化的结构化摘录成书,有利于研究人员更高效地管理海量信息,以及人们从海量内容里快速选择、使用和处理相关领域的文档。
3 o9 O" D Q4 [
$ k* m J7 {! z4 _/ e
所以确切来说,它其实是该学科里面大量研究文章的摘要合集。 但摘要并不是你想的那么简单,这本书里面包含了 2016 年到 2018 年发表过的 150 多篇权威研究论文。仅在过去 3 年,关于锂电子电池的研究论文就发表了超出 53000 篇,这对试图学习这一领域的科学家是一个巨大的挑战,但 AI 的自动扫描和总结输出,能让科学家们把更多时间用在重要的研究上。 |1 C" {( ~+ ?4 `
▲ 图片来自:The Verge,摄影:Adam Berry/Getty Images ! w" c% l; ]& j/ l. ?
虽然它可能和我们想象中的「文采飞扬」、「驰骋墨场」相差千里,但目前它也为研究人员或专业人士展现了一种获取信息的未来方式。 几十年来,机器一直在学习人类语言的微妙之处,虽然深度学习算法不断在更新技术,但就算世界上最能写的 AI 也无法表达出人的独特思想。
" n* D" @+ S3 z: v4 r2 B8 u3 l
不过前几个月 OpenAI 发布一个名为 GPT-2 的新算法,给它一个标题就能进行语言建模完成接下来的情节,最特别的地方就是能够更灵活地变动内容,甚至写出一篇粉丝小说。 * b9 u# Z- E3 t- n! g3 U
$ ~" X8 M' o1 E/ g6 t
▲ 图片来自:openai , ^4 ^; |8 [! b' ^, U
+ q3 u/ t4 X3 {- c ?$ ]可以预见,未来的学术出版以及各类书籍,将不再只是人为创造,而是有更多形式出现,包括了混合人机文本生成的书籍或完全由机器学习生成的文本。 而对于这本书的情况,Springer Nature 的董事总经理 Niels Peter Thomas 说道:
[: Z" [. G5 L$ c4 l q" E0 v* S1 }
围绕自然语言处理和人工智能的新技术,为我们提供了在算法帮助下探索内容生成的新机会。作为全球出版商,我们也有责任考虑机器生成内容的影响、机遇、挑战和风险,并为未来的这类新内容提供基础的框架。
! H O( [! P! N- |' T! ]; T
1 E6 w8 F N, @+ ]3 l: F- j- e
▲ 图片来自:medium " H- j. N+ F7 v) U- p( s
目前 Springer Nature 计划通过开发其他领域的内容来扩展这次的试点项目。而《锂离子电池研究原型》也将成为进一步改进此类技术的基础。 如果你想读一下的话,SpringerLink 数据库里现在也免费为读者提供了电子书版本。
8 b3 L4 V$ k: i3 r2 Q
但或许我们更期待看到的是,AI 直接创造出的不仅是文字方面的协助,而是基于文字本身的更有价值的内容。 毕竟每个人的思维都有限,而算法拥有无限可能。
1 o, a/ g( T9 r |