版权问题不断打击AIGC发展 机构称高质量数据集价值将凸显

【版权问题不断打击AIGC发展 机构称高质量数据集价值将凸显】The Intercept、Raw Story和AlterNet三家新闻机构日前起诉OpenAI、微软,指控它们侵犯版权,称ChatGPT“至少在某些时候”会逐字或近乎逐字地复制受版权保护的新闻作品,但不提供这些作品的作者、标题、版权或使用条款信息。

The Intercept、Raw Story和AlterNet三家新闻机构日前起诉OpenAI、微软,指控它们侵犯版权,称ChatGPT“至少在某些时候”会逐字或近乎逐字地复制受版权保护的新闻作品,但不提供这些作品的作者、标题、版权或使用条款信息。

多模态大模型将成为未来大模型领域的主流趋势,除文字外,优质原创图像、视频内容均将成为数据集的重要来源。目前,OpenAI及其投资者正面临多起诉讼,指控他们使用受版权保护的作品来训练人工智能产品。有法律专家表示,多起案件加在一起,有可能会动摇蓬勃发展的生成式行业的基础。在版权问题的打击下,OpenAI近期被传出正在更加积极地与多家出版商进行谈判,并且也在取得进展。此前,新闻出版巨头施普林格出版集团(Axel Springer)与ChatGPT开发机构OpenAI签署协议,成为全球第一家与OpenAI合作将新闻业与技术进行更深入整合的出版机构。银河证券认为,当前AI政策密集出台,高质量数据集和训练数据版权问题得到重视,未来优质训练数据库的价值将得到凸显。

中信出版已尝试与作者和大模型公司合作语言训练,开发智能阅读应用产品。例如,公司旗下的知识服务平台与百度联合发布了“中信书院AI阅读助手”插件。

视觉中国表示,在AIGC时代,公司的核心优势在于:数字内容交易场景、海量优质版权清晰的数据、创作者内容生态以及丰富的版权管理运营经验。