一方面,利用人工智能工具的创作者开始为自己维权;另一方面,作家、媒体、唱片公司等版权方也在不断起诉人工智能公司

怎么看AI的著作权?

青岛日报 2024年01月19日

  □周晓峰

  人工智能正在迅速席卷各行各业,首当其冲的就是文案、绘图等需要智力创作的行业,由此引发的知识产权、个人隐私保护等问题需要更加重视。

  前不久,全国首例人工智能生成图片著作权侵权案一审判决生效,认定用人工智能模型生成的图片属于著作权保护范畴。在这个案例中,利用人工智能模型生成图片,被视为人利用工具进行创作,整个创作过程中进行智力投入的是人而非人工智能模型。

  当然,人工智能作品拥有著作权的一大前提是其本身不能侵权。

  算力、算法和数据构成了人工智能的三大基础,其中算力是基础设施,算法定义了如何使用数据和算力进行计算和决策,数据相当于算法的“饲料”。当前,以ChatGPT为代表的生成式人工智能,利用复杂的算法、模型和规则,从海量的数据中学习,并生成新的内容。可以说,人工智能的聪明程度不仅取决于算力、算法,更取决于数据的质量和数量,如果把低质量数据乃至虚假信息喂给人工智能,人工智能产生的新内容可能匪夷所思。

  问题在于,人工智能模型采集数据的方式基本上是通过爬虫从互联网上获取,浩如烟海的资讯、书籍、论文、图片、视频等信息构成一个庞大的数据库,其中有相当多的数据可能没有授权,有的还涉及个人隐私。

  这就出现了一个有意思的现象:一方面,利用人工智能工具的创作者开始为自己维权;另一方面,作家、媒体、唱片公司等版权方也在不断起诉人工智能公司。

  在很多从业者看来,人工智能未经允许用自己的创意成果进行训练,“写”出来的作品还有版权,对自己的职业产生冲击,这很不合理。前有《权力的游戏》作者乔治·马丁等作家对人工智能公司OpenAI发起集体诉讼,指控其未经许可使用受版权保护的作品训练人工智能模型,后有《纽约时报》对OpenAI提起诉讼,要求停止使用新闻内容训练人工智能模型。在国内,WPS在隐私政策中提到“我们将对您主动上传的文档材料,在采取脱敏处理后作为AI训练的基础材料使用”,也一度引发侵犯个人隐私的舆情。

  对于人工智能涉及的知识产权保护问题,我国已有明文规定。去年开始施行的《生成式人工智能服务管理暂行办法》提出,生成式人工智能服务提供者应使用具有合法来源的数据和基础模型;涉及知识产权的,不得侵害他人依法享有的知识产权;涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他情形。

  人工智能作为新鲜事物,在赋能千行百业的同时,不免存在着许多灰色地带。应当鼓励创新和行业规范并行,以利于产业更好更长远发展。