- 11/04
- 2016
-
QQ扫一扫
-
Vision小助手
(CMVU)
作为世界上最大的通讯社之一,美联社的合作伙伴包括了上千家来自全球的报纸、广播和电视台。这也意味着,同一个新闻事件,美联社要根据不同的输出媒介,提供不同的文本格式。
拿体育新闻报道来说,当美联社体育新闻记者报道完一场比赛,他们要提供同一个新闻事件的八个不同文字版本。除了写出新闻的纸媒版本,记者还要提供新闻摘要,以及用于电视或广播报道的稿件。麻烦的是,在体育赛事中,通常有多个参赛方,音频稿需要根据每个参赛队伍的赛况进行单独报道。
据统计,美联社的记者们每周一共要花费800小时将这类纸质报道转化为音频稿件,包括广播和电视。
“这简直就是一个噩梦。”美联社的战略和企业发展副主席Jim Kenny说。
为了将记者们从噩梦中拯救出来,美联社这回又想到了机器人。最近,他们正在开发一项利用人工智能将纸媒文本自动转化为音频文本的技术。
过去几个月里,美联社与Matters Ventures公司合作,开发了一套用于自动转化文本的模型。
先由记者将文本转换过程中需要规范的格式提取出来。
这套模型用于规范纸质新闻转化为音频新闻时,需要包含的格式(比如故事更短、句子更简洁、数字四舍五入取整等)。接下来,美联社将和机器学习公司合作,先聚焦于体育报道,再以此为样本开发一套适用于所有内容的自动转化算法。
目前美联社还没对该套模型进行测试,Jim Kenny预计还需要大半年的开发时间,所以我们还无法看到这次机器人的表现到底如何。
不过,采用机器人来写稿早就不是什么新鲜事儿了。两年前,美联社就和自动化写作软件Word Smith合作,完成了大量涉及数字的财经报道写作。
此后,机器人接走的大多是一些不怎么需要动脑子的活,比如《华盛顿邮报》后来用机器人报道的体育新闻。
这回也是一样。美联社战略发展部经理Francesco Marconi对这技术的看法是:
“机器学习可以识别出人是如何对报道内容进行调整的。当然,首先要在机器中设定好这些规则。但要想得到让编辑部满意的报道,机器学习和人工操作还是存在差距。”