学术出版中AIGC使用边界指南 2.0

Guideline on the Boundaries of AIGC Usage in Academic Publishing 2.0 中国科学技术信息研究所 联合
爱思唯尔 · 施普林格·自然 · 约翰威立 · 泰勒-弗朗西斯 · 威科集团 · 剑桥大学出版社
(排名不分先后) 2024年9月 第2版 科技部科技监督与诚信建设司支持

1 背景

2022年11月ChatGPT发布以来,人工智能内容生成(AIGC) 已广泛应用于学术研究。大语言模型(LLMs)通过学习海量在线文本数据的语言统计模式来工作,被科学家用作研究助手,帮助组织思维、编写代码、总结文献。

核心担忧 :科学家/研究人员/学生可能欺骗性地将AIGC生成的文本作为自己的文本,或使用AIGC产生不可靠的研究成果 。AIGC很容易产生错误和误导性信息,且可能无法显示信息来源。

目前COPE、ICMJE、STM,以及各出版商(Elsevier, Springer Nature, Wiley等)已发布相关指南。不同机构在不同时期的表述和要求有所不同,本指南旨在提供一个基本原则框架

2 目标

2.1 防范学术不端

以防范AIGC不当使用为切入点,加强科研诚信意识教育,推进学术诚信治理。

2.2 引导共识

明晰各环节(研究→数据收集→写作→投稿→评审→出版→传播)的最佳行为实践,提供详尽的AIGC使用指导。

3 四大原则

原则核心要求
3.1 透明度和问责制所有使用者必须披露AIGC使用情况;技术开发者需说明训练数据和内容来源;建立问责标准
3.2 隐私和安全尊重隐私和数据保护;注意提交到LLM的信息可能被训练模型抓取;遵守出版机构保密政策
3.3 公平避免偏见;评估偏差来源并建立反馈机制;AIGC可帮助减少语言和文化上的不公平
3.4 可持续发展减少生成式AI对环境的影响;确保数据可查找、可访问、可互操作和可重复使用
行为框架 / 实践指导 研究开展与撰写 → 投稿阶段 → 发表/出版后

4 研究开展和论文撰写阶段

4.1.1 资料收集

可以借助AIGC

  • 收集关键词/主题相关参考文献
  • 分类梳理、总结参考文献结论
  • 发现新信息来源、跟踪最新进展
  • 回答简单概念问题
  • 采集观点、情感及倾向数据

必须注意

  • AIGC提供的参考文献可能是虚构或过时
  • 必须逐项验证真实性和准确性
  • 做出人为主导的决策
  • 对观点资料进行清洗处理
  • 防止传播不正确、有偏见或歧视性信息

4.1.2 统计分析

可以 :借助AIGC选择分析方法、解释数据、计算统计指标、获取统计分析建议。 必须 :所用数据须是研究人员自行实验收集或其他合理方式获得;需对AIGC提供的统计结果进行验证 ;结合可靠工具和专业判断,最终自行决定是否采纳建议。

4.1.3 图表制作

可以借助AIGC

  • 推荐合适的统计图表类型
  • 调整字体、数据标注、图例、颜色
  • 调整亮度和对比度(不丢失原始信息)
  • 添加图例和图像标注

严禁/限制

  • 蛋白质印迹实验图 等实验生成类图像不可通过AIGC生成
  • 图形摘要 不允许使用AIGC或AI辅助工具
  • 增强、模糊、移动、删除或引入图像中的特定特征不可接受
  • 封面艺术需事先获得编辑和出版商许可

修改图像时须详细描述修改过程,包括使用的工具名称、版本号和制造商信息,确保透明度和可追溯性

4.1.4 文字撰写

可以 :提高文本可读性、启发内容逻辑性、提供句式、总结学术出版物、生成文献综述初稿供参考。 不可以 :用来产生研究假设、直接撰写整篇论文文本、解释数据、得出科学结论。所有属于科学或智力贡献的任务都应由研究人员自己完成

4.1.5 语言和润色

可以 :作为高标准语言检查器,帮助非英语母语研究人员润色稿件、提高可读性。 注意 :将手稿输入公共或低安全标准的AIGC工具时,内容可能成为训练语料库的一部分。使用前应与共同作者、资助者、出版商预先达成一致意见

4.1.6 引文整理

  • 引用相关性 至关重要——确保引用与论文切实相关
  • AIGC可检查引文格式、自动生成引文、自动排序参考文献
  • 但作者必须对引文负责 ,仔细核对格式和内容 1’

5 投稿阶段

5.1 作者署名

AIGC不能列为文章作者 :在没有人工监督和指导下,不应让AIGC独立发起、进行或制作研究成果。AIGC没有法律地位或持有/转让版权的能力。根据COPE立场声明,AIGC不能履行作者角色。

5.2 规范引用

所有来自其他来源的内容必须经过仔细确认、恰当引用标注。AIGC提供的资料需验证真实性,并对其底层数据来源、工具、获取方式、处理等进行引用标注。

5.3 披露和声明

必须明确披露的内容

  • 使用者
  • AI技术或系统(需注明版本号
  • 使用的时间和日期
  • 用于生成文本的提示和问题
  • 文本中由AIGC编写或共同编写的部分
  • 论文中因使用AIGC而产生的想法

若使用AIGC撰写了稿件任何部分,必须在方法或致谢部分公开、透明、详细地描述

披露声明模板

“声明:在本作品的准备过程中,作者使用了 [AIGC工具/服务名称][使用目的] 。使用此工具/服务的日期和时间为 [具体日期和时间] ,并通过 [提示和问题] 生成了相关文本。使用此工具/服务后,作者根据需要对内容进行了审查和编辑,并对出版物的内容承担全部责任。“

5.4 同行评审

可以

  • AIGC可汇总和分类标注评审意见
  • 推荐合适的回复内容
  • 评审员可负责任地使用AIGC提取关键信息来审查或协助起草评审意见

不可以

  • 不得将评审报告上传到AIGC(机密文件)
  • 评审员不得将未发表手稿上传到AI工具
  • AI只能用于改进审稿人的评论,而非处理被审内容

6 论文发表/出版后

6.1 数据仓储和共享

  • 鼓励作者公开原始数据,审查防范数据污染、造假
  • 对论文数据进行严格检查:来源准确性、收集/处理方法、测量精度
  • 及时、准确、详细记录实验和数据收集过程

6.2 AIGC相关材料提交、存档

鼓励分享研究数据(原始数据、处理后数据、软件、算法、协议等),特别是AIGC生成或处理过的文本、图片、程序 应作为补充材料提交、存档。

6.3 AIGC内容检测

  • 期刊和编辑使用检测工具时须注意安全性 ,防止信息泄露
  • 建立审查程序时注意误报问题
  • 检测结果作为辅助判断依据 ,综合研判处理
  • 未声明直接使用AIGC生成稿件文字构成学术不端

7 案例分析

案例1:作者将道德和诚信问题归咎于ChatGPT

经过 :审稿人发现引用错误及不存在的文献。作者承认使用ChatGPT撰写手稿但未核实内容真实性,也未验证引用来源。

结果 :作者请求删除ChatGPT内容并重写,但被拒绝——初始提交时未声明使用ChatGPT且未核实所有内容,构成严重学术不端。稿件被拒绝发表。

案例2:某医疗团队论文撤稿事件

经过 :2024年4月发表一篇声称碱性水可减轻慢性痛风性关节炎疼痛的论文,3个月后即被撤稿。

问题

  • AI生成图像 :骨头数量错误,标签无意义(如”chlsinkestead atlvs no active greedis”)
  • AI生成文本 :介绍部分由AI生成,严重影响准确性和专业性
  • 虚假参考文献 :在PubMed或Google Scholar中无法找到
  • 不合理的统计数据 :疼痛评分数据表现出捏造迹象
  • 非机构邮箱 :作者身份真实性存疑

结果 :2024年7月12日撤稿,期刊正在改进编辑审查流程。

8 总结

指南性质 :本指南为AIGC技术使用提供启发式框架不优先于或取代个别出版社的任何政策或指导 。各出版商政策和做法可能不同,鼓励作者、编辑和审稿人始终熟悉个人出版商/期刊网站上记录的政策。 2.0版核心更新

  • 新增案例分析 部分,通过实践案例深化理解
  • 针对图表制作文字撰写 的规范化进行调整与优化
  • 完善同行评审流程 中的AIGC使用指导
  • 紧密贴合科技与学术领域最新发展

9 速查:AIGC使用边界一览

环节可以不可以
资料收集辅助文献检索、概念解答直接引用未验证的参考文献
统计分析辅助选择方法、解释数据替代人工判断和验证
图表制作推荐图表类型、调整样式生成实验图像、图形摘要
文字撰写提高可读性、启发逻辑产生假设、直接撰写全文
语言润色检查语法、改进表达(需注意数据安全)
作者署名在致谢中披露使用列为文章作者
同行评审汇总评审意见、推荐回复上传手稿/评审报告到AI

笔记整理自《学术出版中AIGC使用边界指南2.0》PDF文件

原文来源:中国科学技术信息研究所联合多家国际出版集团,2024年9月

整理:覆水 (Fushui) | OpenClaw