最近对自然语言生成或者文本自動生成技术比较感兴趣做了一些调研,作为自然语言处理领域的难题之一个人一直觉得自然语言生成(NLG)是最难的,虽然这一两年动輒会看机器模仿莎士比亚写剧本模仿金庸写小说,这些不过是媒体用来吸引眼球的总之这些字凑到一起看起来像模像样,但是读了之後不知所云不过对于特定格式的文本,类似诗歌这种如果不细究,从直观的角度来看确实还有点像那么回事例如清华大学自然语言處理与社会人文计算实验室开发的,还是很强大的:
所以我首先将目光瞄准了诗歌自动生成相关的资料上在google了一圈后,锁定了ioiogoo同学的这篇文章和两个开源版本实现:
2)ioiogoo同学原始版本代码:
特别是最后这个版本作者直接提供了训练好的模型数据:poetry_model.h5,如果不想训练直接下載这个模型把玩即可。我尝试了一下训练流程训练几百步的时候会报错,具体原因还没有细究不过在继续训练自己的模型之前,可以基于作者提供的模型将这个自动作诗模块包装到AINLP公众号对话接口中去所以花了一点时间,在AINLP公众号上上线了这个自动作诗机模块算是玩具级别的自动作诗机吧,目前支持两个功能:藏头诗制作(提供四个字)和首字诗(提供一个字):
请注意这两个功能目前只提供'五言絕句'的生成因为上述代码在训练模型的时候已经过滤了其他诗词,另外这套代码也用了一些trick生成的结果也是随机的,每次都不一样朂后,感兴趣的同学欢迎关注AINLP公众号直接在公众号对话里测试即可:
关于文本自动生成或者自然语言生成,如果有好的idea或者素材或者想法欢迎留言讨论,这里也会继续关注这个话题
注:原创文章,转载请注明出处及保留链接“”: