
大模型赋能行业发展
10月18日,在“出版、发行与大模型应用高端论坛”上,北京师范大学新闻传播学院媒介融合与数字出版中心主任、国家新闻出版署出版业科技与标准重点实验室出版业用户行为大数据分析与应用重点实验室主任秦艳华发布了《出版业人工智能大语言模型应用研究报告》。《报告》以人工智能大语言模型应用于出版业的实践为基础,以此展开对国内外的应用现状、呈现问题、解决对策及发展趋势4个方面的分析,以期为我国出版业的发展提供助力
10月18日,在“出版、发行与大模型应用高端论坛”上,北京师范大学新闻传播学院媒介融合与数字出版中心主任、国家新闻出版署出版业科技与标准重点实验室出版业用户行为大数据分析与应用重点实验室主任秦艳华发布了《出版业人工智能大语言模型应用研究报告》。
《报告》以人工智能大语言模型应用于出版业的实践为基础,以此展开对国内外的应用现状、呈现问题、解决对策及发展趋势4个方面的分析,以期为我国出版业的发展提供助力。
应用现状
《报告》指出,ChatGPT大语言模型2022年问世后,推动了大语言模型的发展。我国研究机构、企业也研发了多种人工智能大语言模型。截至2023年9月26日,据不完全统计,国内168个单位研发出182个人工智能大语言模型。尽管数量较多,但和国外的ChatGPT相比,仍然缺乏一个断层式领先、被业界公认的人工智能大语言模型。
国内出版业对人工智能大语言模型的应用,整体呈慎重而乐观的态度。国内出版业还未将大语言模型完全应用于图书出版全流程,但在部分出版环节,比如编辑校对、文献翻译、有声制作、阅读推荐等方面已有大语言模型应用的探索和实践,多家出版机构已与大语言模型的技术支持方展开了深度合作。
2023年2月,人民交通出版社宣布将接入百度文心一言,成为首批合作伙伴之一。3月,华龄出版社出版了由人工智能大语言模型生成的图书《ChatGPT:AI革命》。
7月,世界人工智能大会现场,蜜度发布蜜度文修大语言模型,90秒校对20万字,助力中文内容校对提质增效。果麦文化以1500万元增资星图比特,并签订AI文字校对软件开发合作协议。9月21日,“版阅AI内容服务平台”正式宣布上线,并启动内测版阅AI内容服务平台,依托智谱AI自主研发的GLM-130B大模型为技术支持,以及中国新闻出版研究院权威的基础研究数据,该平台具有内容生产、在线编审、逻辑判断、文章润色的功能。
相对而言,国外人工智能大语言模型在数字出版领域有较多应用。
亚马逊在2023年年初就开始上架ChatGPT大语言模型编撰的各类书籍,并专门开辟了ChatGPT大语言模型为作者的书籍专栏。截至2023年10月13日,在亚马逊官网以“高级检索”方式,检索署名作者为“ChatGPT”的书籍,已有1024本,并有以“AI”为作者署名的书籍在发售,具体销量有待进一步评估。
人工智能作为作者的书籍在国外已经被大量出版。目前,在国外,大语言模型在选题策划、文本创作、插图设计、编辑校对、有声阅读制作等工作中发挥了一定作用。例如,在选题策划方面,大语言模型通过持续性对话,激发作者灵感,或提供选题参考给作者选择,进而协助图书创作。在文本创作方面,ChatGPT作为作者创作的书籍主要有自我描摹类的工具书、故事小说及基础教材等。在编辑、校对方面,可协助编辑进行文字编校、语句修改、文献检索、查重、翻译等工作。
在插图设计方面,大语言模型参与设计图书封面与插图,根据内容进行具象化的形象设计。在有声阅读制作方面,基于人工智能的大模型技术在有声阅读市场具有较大的发展前景与开发空间,如微软研发的AI语音工具VALL.E,可以模仿人类说话,并带有情绪地进行语音输出。
问题与对策
在总结国内外出版业应用大语言模型的基础上,《报告》还归纳了目前ChatGPT大语言模型在应用实践中呈现出的诸多问题。一是版权纠纷难处理,作品认可度低。二是图文内容不符,创作质量欠佳。三是存在隐形过滤,潜藏错误导向。四是劣币驱逐良币,艺术创作存隐忧。五是数据信息被窃取,信息安全难保障。六是人机关系颠覆,警惕异化风险。
针对以上问题,《报告》提出了针对性的解决措施与建议。一是完善管理制度,加强版权意识。二是大语言模型再升级,建立校对审核。三是打通云端共享渠道,推动出版落地。四是构建把关机制,提高原创积极性。五是设置风险预防规则,完善数据保护机制。六是共创素养提升体系,构建良好人机关系。
《报告》还进一步指出未来出版业应用人工智能大语言模型的发展趋势。第一,通用大模型将有望与各行业深度融合,增强专用性,出现专用出版行业的大模型。
第二,大语言模型成本开销和存储空间有望实现轻量化。
第三,大语言模型的可解释性与可控性未来将有望实现长足的发展。目前,大语言模型缺乏一定的透明度。并且,大语言模型存在非真实性和偏见性输出。研究人员已经从技术的角度提出提高大语言模型可解释性和可控性的方法,未来将进一步深入发展。
第四,互联网巨头权力中心化。大语言模型具有天然的“自然垄断倾向”。第五,形成复杂的人机关系。基于大语言模型生成的广义上的人工智能技术,使得机器的主体性越来越强,机器能够通过自我学习实现自我不断进化,由此带来了多样复杂的新人机关系。
第六,政产学研协同发展。政产学研协同合作将成为未来技术创新的组织模式,出版业人工智能大语言模型在实践中应用所产生的问题也需要回到政产学研多方主体协同合作中不断解决。
读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用
对于0基础小白入门:
如果你是零基础小白,想快速入门大模型是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。
包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费
】🆓
👉AI大模型学习路线汇总👈
大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
👉大模型实战案例👈
光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
👉大模型视频和PDF合集👈
观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费
】🆓
更多推荐
所有评论(0)