网路暨智慧财产权从科技部开放AI语音数据资料集谈资料的

从科技部开放AI语音数据资料集谈资料的「权利」变化

赖文智律师

科技部日前宣布对外开放AI语音数据资料集内容,首波将提供「科技大擂台 与AI对话」竞赛所使用语音试题资料,内容长度达400小时,除了自行录製资料,更结合内政部警政署警察广播电台,以及教育部国立教育广播电台所提供相关语音资料,经由北科大电子工程系副教授廖元甫与背后学生团队协助精準标记后,再彙整成高品质数据库公开释出。  

对于有志于AI语音相关服务开发的团体而言,当然是好消息,不需要自己从无到有一步一步蒐集语音内容、辨识、标记、校正,就可以有初步的资料源进行训练,还是免费的。但这会不会好到不像是真的(too good to be true)?从法律上来看,还真的有可能有问题。


一、由取得来源看语音资料可能涉及的权利


由前述科技部新闻稿的内容来看,本次开放的语音资料,包含有科技部自行录製的资料、警察广播电台、教育广播电台的广播内容,而这些语音的内容还要再加上廖元甫教授及其学生团队进行精準标记,才成为可以供竞赛团队及未来开放予公众的语音资料源。  

我们可以先来看一下警察广播电台、教育广播电台的广播内容,广播节目的主持人可能是受雇或受聘于广播电台,广播节目的来宾可能领了车马费、出席费,录製声音的工作人员可能是受雇或受聘于广播电台,若由「着作权」的角度来看语音资料的问题,至少广播节目的主持人、来宾被录製下来的访谈互动的声音,作为一个以录音物形式存在的语文着作,着作权应该可以透过「契约」处理好来,直接让着作财产权归属于广播电台,从而广播电台可以对外授权利用。 

至于由廖元甫教授及其学生团队针对电脑语音辨识的结果,再进行精準校正与标记,这是创作吗?从法律上来说并不是,因为并没有投入额外的创作活动,只是针对广播电台录製下来的语音内容,校正其文字使其与语音相互对应,而得作为训练AI的资料源。因此,可以推测「着作权」大概是本次科技部宣布开放AI语音数据资料集内容的主要评估重点。

二、科技部是否有「完整」权利可以对外授权?又授的是什幺权?


然而,广播电台录製下来的语音资料,只要评估、处理「着作权」就够了吗?我们可以先来看2019年3月的这则新闻「IBM 未经授权自 Flickr 下载百万张人脸照片训练 AI 人脸辨识」(http://technews.tw/2019/03/13/ibm-didnt-inform-people-when-it-used-their-flickr-photos/),「根据报导指出,针对 IBM 所获得的 100 万张照片,虽然摄影师可能获准拍摄照片当中的人物,但是这些人并不知道自己的照片被用于训练人脸辨识程式。」这些Flickr的照片是经过整理以创用CC的方式授权,所以,若单纯由着作权的角度来观察,其实IBM并没有侵害着作权的问题,关键在于被拍摄者从未认知到含有其肖像的照片,可能被用于训练AI的资料,进而可能会发展出对其有利或不利的AI产品或服务。 

可能大家会觉得因为照片含有他人的肖像,所以,有肖像权的问题。但广播电台的语音资料并不涉及肖像,应该就没有问题。但是,别忘了,现在的AI早已可以用你的脸、你的声音,说出你没说的话,而且,你还发现不了到底「假」在哪里?有理都说不清了。亦即,当你的声音被透过适当的方式蒐集、分析之后,要重新合成一个你自己都分辨不出真假的声音,早就已经不是AI工程师要挑战的目标了。 

因此,我们在思考AI训练所需大量资料源时,在思考谁拥有资料的权利之前,更应该思考资料的蒐集与利用「应该」考量到哪些权利?如果是你,即令是在公开场合下或同意的情形下被拍摄或录製下来的肖像或声音,你真的愿意被他人蒐集、利用于AI的各种训练或应用上吗?如果有一天,Siri的发音就是你的声音,你会不会觉得怪怪的?还是觉得很温馨?

从科技部开放AI语音数据资料集谈资料的「权利」变化(上)、(下) 


Copyright IS-Law.com
语音资料ai广播电台声音科技部录製着作权