学术出版中AIGC使用边界指南 2.0
Guideline on the Boundaries of AIGC Usage in Academic Publishing 2.0 中国科学技术信息研究所 联合
爱思唯尔 · 施普林格·自然 · 约翰威立 · 泰勒-弗朗西斯 · 威科集团 · 剑桥大学出版社
(排名不分先后) 2024年9月 第2版 科技部科技监督与诚信建设司支持
1 背景
2022年11月ChatGPT发布以来,人工智能内容生成(AIGC) 已广泛应用于学术研究。大语言模型(LLMs)通过学习海量在线文本数据的语言统计模式来工作,被科学家用作研究助手,帮助组织思维、编写代码、总结文献。
核心担忧 :科学家/研究人员/学生可能欺骗性地将AIGC生成的文本作为自己的文本,或使用AIGC产生不可靠的研究成果 。AIGC很容易产生错误和误导性信息,且可能无法显示信息来源。
目前COPE、ICMJE、STM,以及各出版商(Elsevier, Springer Nature, Wiley等)已发布相关指南。不同机构在不同时期的表述和要求有所不同,本指南旨在提供一个基本原则框架 。
2 目标
2.1 防范学术不端
以防范AIGC不当使用为切入点,加强科研诚信意识教育,推进学术诚信治理。
2.2 引导共识
明晰各环节(研究→数据收集→写作→投稿→评审→出版→传播)的最佳行为实践,提供详尽的AIGC使用指导。
3 四大原则
| 原则 | 核心要求 |
|---|---|
| 3.1 透明度和问责制 | 所有使用者必须披露AIGC使用情况;技术开发者需说明训练数据和内容来源;建立问责标准 |
| 3.2 隐私和安全 | 尊重隐私和数据保护;注意提交到LLM的信息可能被训练模型抓取;遵守出版机构保密政策 |
| 3.3 公平 | 避免偏见;评估偏差来源并建立反馈机制;AIGC可帮助减少语言和文化上的不公平 |
| 3.4 可持续发展 | 减少生成式AI对环境的影响;确保数据可查找、可访问、可互操作和可重复使用 |
| 行为框架 / 实践指导 研究开展与撰写 → 投稿阶段 → 发表/出版后 |
4 研究开展和论文撰写阶段
4.1.1 资料收集
可以借助AIGC
- 收集关键词/主题相关参考文献
- 分类梳理、总结参考文献结论
- 发现新信息来源、跟踪最新进展
- 回答简单概念问题
- 采集观点、情感及倾向数据
必须注意
- AIGC提供的参考文献可能是虚构或过时 的
- 必须逐项验证真实性和准确性
- 做出人为主导的决策
- 对观点资料进行清洗处理
- 防止传播不正确、有偏见或歧视性信息
4.1.2 统计分析
可以 :借助AIGC选择分析方法、解释数据、计算统计指标、获取统计分析建议。 必须 :所用数据须是研究人员自行实验收集或其他合理方式获得;需对AIGC提供的统计结果进行验证 ;结合可靠工具和专业判断,最终自行决定是否采纳建议。
4.1.3 图表制作
可以借助AIGC
- 推荐合适的统计图表类型
- 调整字体、数据标注、图例、颜色
- 调整亮度和对比度(不丢失原始信息)
- 添加图例和图像标注
严禁/限制
- 蛋白质印迹实验图 等实验生成类图像不可通过AIGC生成
- 图形摘要 不允许使用AIGC或AI辅助工具
- 增强、模糊、移动、删除或引入图像中的特定特征不可接受
- 封面艺术需事先获得编辑和出版商许可
修改图像时须详细描述修改过程,包括使用的工具名称、版本号和制造商信息,确保透明度和可追溯性 。
4.1.4 文字撰写
可以 :提高文本可读性、启发内容逻辑性、提供句式、总结学术出版物、生成文献综述初稿供参考。 不可以 :用来产生研究假设、直接撰写整篇论文文本、解释数据、得出科学结论。所有属于科学或智力贡献的任务都应由研究人员自己完成 。
4.1.5 语言和润色
可以 :作为高标准语言检查器,帮助非英语母语研究人员润色稿件、提高可读性。 注意 :将手稿输入公共或低安全标准的AIGC工具时,内容可能成为训练语料库的一部分。使用前应与共同作者、资助者、出版商预先达成一致意见 。
4.1.6 引文整理
- 引用相关性 至关重要——确保引用与论文切实相关
- AIGC可检查引文格式、自动生成引文、自动排序参考文献
- 但作者必须对引文负责 ,仔细核对格式和内容 1’
5 投稿阶段
5.1 作者署名
AIGC不能列为文章作者 :在没有人工监督和指导下,不应让AIGC独立发起、进行或制作研究成果。AIGC没有法律地位或持有/转让版权的能力。根据COPE立场声明,AIGC不能履行作者角色。
5.2 规范引用
所有来自其他来源的内容必须经过仔细确认、恰当引用标注。AIGC提供的资料需验证真实性,并对其底层数据来源、工具、获取方式、处理等进行引用标注。
5.3 披露和声明
必须明确披露的内容 :
- 使用者
- AI技术或系统(需注明版本号 )
- 使用的时间和日期
- 用于生成文本的提示和问题
- 文本中由AIGC编写或共同编写的部分
- 论文中因使用AIGC而产生的想法
若使用AIGC撰写了稿件任何部分,必须在方法或致谢部分公开、透明、详细地描述 。
披露声明模板
“声明:在本作品的准备过程中,作者使用了 [AIGC工具/服务名称] 来 [使用目的] 。使用此工具/服务的日期和时间为 [具体日期和时间] ,并通过 [提示和问题] 生成了相关文本。使用此工具/服务后,作者根据需要对内容进行了审查和编辑,并对出版物的内容承担全部责任。“
5.4 同行评审
可以
- AIGC可汇总和分类标注评审意见
- 推荐合适的回复内容
- 评审员可负责任地使用AIGC提取关键信息来审查或协助起草评审意见
不可以
- 不得将评审报告上传到AIGC(机密文件)
- 评审员不得将未发表手稿上传到AI工具
- AI只能用于改进审稿人的评论,而非处理被审内容
6 论文发表/出版后
6.1 数据仓储和共享
- 鼓励作者公开原始数据,审查防范数据污染、造假
- 对论文数据进行严格检查:来源准确性、收集/处理方法、测量精度
- 及时、准确、详细记录实验和数据收集过程
6.2 AIGC相关材料提交、存档
鼓励分享研究数据(原始数据、处理后数据、软件、算法、协议等),特别是AIGC生成或处理过的文本、图片、程序 应作为补充材料提交、存档。
6.3 AIGC内容检测
- 期刊和编辑使用检测工具时须注意安全性 ,防止信息泄露
- 建立审查程序时注意误报问题
- 检测结果作为辅助判断依据 ,综合研判处理
- 未声明直接使用AIGC生成稿件文字构成学术不端
7 案例分析
案例1:作者将道德和诚信问题归咎于ChatGPT
经过 :审稿人发现引用错误及不存在的文献。作者承认使用ChatGPT撰写手稿但未核实内容真实性,也未验证引用来源。
结果 :作者请求删除ChatGPT内容并重写,但被拒绝——初始提交时未声明使用ChatGPT且未核实所有内容,构成严重学术不端。稿件被拒绝发表。
案例2:某医疗团队论文撤稿事件
经过 :2024年4月发表一篇声称碱性水可减轻慢性痛风性关节炎疼痛的论文,3个月后即被撤稿。
问题 :
- AI生成图像 :骨头数量错误,标签无意义(如”chlsinkestead atlvs no active greedis”)
- AI生成文本 :介绍部分由AI生成,严重影响准确性和专业性
- 虚假参考文献 :在PubMed或Google Scholar中无法找到
- 不合理的统计数据 :疼痛评分数据表现出捏造迹象
- 非机构邮箱 :作者身份真实性存疑
结果 :2024年7月12日撤稿,期刊正在改进编辑审查流程。
8 总结
指南性质 :本指南为AIGC技术使用提供启发式框架 ,不优先于或取代个别出版社的任何政策或指导 。各出版商政策和做法可能不同,鼓励作者、编辑和审稿人始终熟悉个人出版商/期刊网站上记录的政策。 2.0版核心更新 :
- 新增案例分析 部分,通过实践案例深化理解
- 针对图表制作 和文字撰写 的规范化进行调整与优化
- 完善同行评审流程 中的AIGC使用指导
- 紧密贴合科技与学术领域最新发展
9 速查:AIGC使用边界一览
| 环节 | 可以 | 不可以 |
|---|---|---|
| 资料收集 | 辅助文献检索、概念解答 | 直接引用未验证的参考文献 |
| 统计分析 | 辅助选择方法、解释数据 | 替代人工判断和验证 |
| 图表制作 | 推荐图表类型、调整样式 | 生成实验图像、图形摘要 |
| 文字撰写 | 提高可读性、启发逻辑 | 产生假设、直接撰写全文 |
| 语言润色 | 检查语法、改进表达 | (需注意数据安全) |
| 作者署名 | 在致谢中披露使用 | 列为文章作者 |
| 同行评审 | 汇总评审意见、推荐回复 | 上传手稿/评审报告到AI |
笔记整理自《学术出版中AIGC使用边界指南2.0》PDF文件
原文来源:中国科学技术信息研究所联合多家国际出版集团,2024年9月
整理:覆水 (Fushui) | OpenClaw