Identifying

Identifying Potential Reviewers Through Academic Search Tools: A Strategic Approach

学术编辑和会议组织者在寻找审稿人时，长期面临一个核心痛点：如何快速定位活跃且匹配的学者。传统依赖个人通讯录或投稿系统推荐的方式，容易导致审稿周期延长或专业匹配度下降。根据《自然》杂志2023年对全球研究人员的调查，超过40%的编辑表示“寻找合适的审稿人”是同行评审流程中最大的瓶颈。与此同时，科睿唯安（Clarivate）2024年发布的《同行评审全球洞察》报告指出，约30%的审稿邀请因研究者“不在该领域活跃”而被拒绝。利用学术搜索工具进行系统性检索，正成为解决这一问题的关键策略。本文将从覆盖度、检索语法、导出格式和API支持四个维度，评测Google Scholar、Scopus、Web of Science和PubMed等主流工具，提供可操作的审稿人识别方法。

覆盖度：不同数据库的学科偏向

Google Scholar 的覆盖范围最广，收录了约3.89亿条记录（截至2024年数据），涵盖预印本、会议论文和灰色文献。但其学科偏向明显：工程、计算机科学和社会科学类文献占比超过60%，而生物医学领域的更新速度落后于PubMed。对于跨学科研究，Scholar的覆盖面优势显著，但需注意重复记录和低质量来源。

Scopus 由爱思唯尔运营，收录了约8,500万条记录（2024年数据），侧重生命科学、健康科学和物理科学，覆盖率分别占其总量的34%、31%和22%。其作者标识符功能可自动整合同一学者的发表记录，减少重名干扰，适合快速评估候选审稿人的产出量。

Web of Science (WoS) 核心合集收录约7,400万条记录，以自然科学和工程技术为主，但社会科学与人文艺术覆盖率相对较低（约12%）。WoS的被引次数和H指数计算更为严谨，仅统计正式期刊论文，适合对审稿人学术影响力进行标准化评估。对于中国学者，知网（CNKI）和万方数据覆盖了约8,000万条中文文献，是识别本土审稿人不可替代的来源。

检索语法：构建精准的审稿人候选列表

Google Scholar 支持布尔运算符（AND、OR、-）和引号精确匹配。例如，要寻找“机器学习”和“医学影像”交叉领域的审稿人，可使用检索式："machine learning" "medical imaging" -review -survey。此语法可排除综述类文献，聚焦原创研究作者。Scholar的高级搜索允许限定年份范围（如2020-2024），但无法直接按作者机构或资助机构过滤。

Scopus 的检索语法更强大，支持字段限定符（AUTHOR-NAME、AFFIL、TITLE-ABS-KEY）和复合嵌套。一个典型检索式：TITLE-ABS-KEY("deep learning" AND "cardiology") AND PUBYEAR > 2019 AND DOCTYPE(ar)。此式返回2020年后发表的期刊论文，结果可直接按被引次数排序，优先定位高被引作者。Scopus还提供作者预搜索功能，输入姓名后系统自动匹配可能的学者，减少误判。

Web of Science 的检索语法与Scopus类似，但其引文索引支持“共被引”分析。检索式示例：TS=(quantum computing) AND PY=(2020-2024) AND DT=(Article)。WoS的“创建引文报告”功能可一键生成候选作者的引用趋势图，帮助判断其研究活跃度是否持续。对于中文数据库，知网支持专业检索语法：SU=‘人工智能’*‘教育’ AND YE=‘2023’，其中“*”代表AND，“+”代表OR。

导出格式：批量处理审稿人信息

Google Scholar 的导出功能最弱，仅支持单条记录导出为BibTeX、EndNote或CSV格式。对于需要批量处理数百条候选记录的编辑，Scholar的导出效率低下。一个变通方法是使用第三方工具（如Publish or Perish）抓取Scholar数据，但存在被屏蔽的风险。

Scopus 支持批量导出最多2,000条记录，格式包括CSV、RIS、BibTeX和Excel。CSV格式包含作者姓名、所属机构、邮箱（若开放）、摘要和参考文献数。编辑可将CSV导入Excel或Python脚本，按发表篇数、被引次数或国家进行降序筛选。Scopus的导出作者列表功能可一次性导出所有匹配作者的ID、姓名和隶属关系，节省重复劳动。

Web of Science 的导出上限为500条记录（纯文本格式）或1,000条（Excel）。导出的字段包含作者全名、地址、DOI和基金信息。对于识别中国审稿人，WoS的“地址”字段包含中文机构英文名称，可配合Excel的筛选功能快速定位特定大学或研究所的学者。PubMed支持导出为XML或CSV，但字段较少，缺少被引次数，更适合初步筛选而非深度评估。

API支持：自动化审稿人推荐系统

Scopus 和 Web of Science 均提供RESTful API，允许编辑或出版商构建自动化审稿人推荐工具。Scopus Search API允许每次请求返回最多200条结果，支持按作者ID、文献标题和关键词查询。例如，通过调用https://api.elsevier.com/content/search/scopus?query=TITLE-ABS-KEY(cancer immunotherapy)，可返回包含作者邮箱和ORCID的数据。此API的速率限制为每5秒1次请求，适合小规模集成。

Web of Science 的API（WoS Starter API）允许查询核心合集，每次返回最多100条记录，支持按被引次数排序。对于需要实时匹配审稿人的出版平台，WoS API可结合作者相似度算法，根据候选人的发表主题与投稿论文的相似度评分进行排序。Google Scholar未提供官方API，但存在非官方抓取接口（如SerpAPI），稳定性差且违反其服务条款。PubMed的E-utilities API免费且无速率限制，适合大规模抓取生物医学领域的作者信息，但无法直接获取被引数据。

评估审稿人活跃度的关键指标

发表频率是判断学者活跃度的直接指标。通过学术搜索工具检索近3年（2021-2024）的论文数量，可识别高产作者。Scopus的作者产出报告显示每年发表篇数，若该学者年均发表量低于2篇，可能已转向非研究岗位。被引半衰期反映研究影响力持续时间，WoS的“被引半衰期”功能可筛选出长期被引的学者，这类审稿人通常对领域发展有持续贡献。

合作网络也是重要参考。通过Scopus的合著者网络或WoS的“共被引”分析，可判断候选审稿人是否与投稿作者存在频繁合作。若两人近5年合著超过3篇论文，应避免邀请以避免利益冲突。审稿历史可通过Publons（现整合至Web of Science）查询，该平台记录学者的审稿次数和期刊偏好。截至2024年，Publons已收录超过300万条审稿记录，编辑可直接查看候选人的审稿活跃度评分。

中文数据库的特殊价值

对于涉及中国科研人员或中文文献的审稿人识别，知网（CNKI） 和 万方数据 不可替代。知网收录了超过6,000万篇中文期刊论文、会议论文和学位论文（2024年数据），其学者库功能整合了作者的中英文名称、研究方向和基金项目。检索式示例：主题=‘深度学习’ AND 作者单位=‘清华大学’ AND 发表时间=2023，可快速定位清华大学在该领域的活跃作者。

万方数据的相似作者推荐功能基于文献耦合算法，输入一篇核心论文后自动推荐研究主题相似的学者。对于评审中文投稿，万方的学科分类（如“计算机科学技术”下的“人工智能”）比英文数据库更贴合中国学科体系。但需注意，知网和万方的导出格式仅支持Excel和TXT，且API接口需商业授权，不适合个人编辑使用。

避免常见陷阱：重名与虚假作者

重名问题在中文拼音（如“Wang, Y.”）中尤为突出。Scopus的作者标识符（Author ID）可区分不同学者，每个ID对应唯一学者，并显示其发表记录和隶属机构变化。编辑应优先使用Author ID而非姓名进行检索。Google Scholar的“作者页面”功能也能聚合同一学者的文献，但需学者自行维护，更新不及时。

虚假或冗余作者在学术搜索中屡见不鲜。部分文献因作者姓名拼写错误或机构变更导致重复记录。WoS的“合并记录”功能在导出前可自动去重，Scopus则允许手动合并作者ID。建议编辑在批量导出后，通过ORCID（开放研究者与贡献者标识符）进行交叉验证。截至2024年，全球约有1,200万学者注册了ORCID，其中中国学者占比约8%。若候选审稿人未注册ORCID，可通过其所在机构的官方研究者页面核实。

FAQ

Q1：如何用Google Scholar快速筛选出近3年活跃的审稿人？

在Google Scholar搜索框中输入"machine learning" AND "medical imaging"，然后点击左侧“Since 2021”筛选近3年文献。将结果按“被引次数”排序，优先选择被引量前10%的作者。但注意Scholar不提供直接导出功能，需手动记录作者姓名，再通过Scopus或WoS获取详细数据。此方法耗时约15分钟，适合初步筛选。

Q2：Scopus的Author ID和Web of Science的ResearcherID有什么区别？

Scopus Author ID由系统自动生成，基于文献元数据匹配，每个学者有唯一ID，且无法修改。Web of Science的ResearcherID由学者自行注册，可手动合并发表记录。截至2024年，Scopus约有1,700万个Author ID，而ResearcherID注册用户约300万。建议优先使用Author ID进行批量检索，因其覆盖率更高且数据更稳定。

Q3：如何避免邀请到与投稿作者有合作关系的审稿人？

使用Scopus的“合著者”功能，输入投稿作者的Author ID，系统自动列出近5年所有合著者及其合作次数。若候选审稿人出现在该列表中且合作次数≥3，应排除。也可通过WoS的“共被引”分析，查看候选人与投稿作者的引用关系。此操作耗时约5分钟，可降低50%以上的利益冲突风险。

参考资料

Clarivate. 2024. Web of Science Core Collection Fact Sheet.
Elsevier. 2024. Scopus Content Coverage Guide.
Nature. 2023. Peer Review Survey: Challenges and Solutions.
中国知网. 2024. CNKI学术资源总库收录统计报告.
ORCID. 2024. ORCID Annual Report: Global Researcher Adoption.
Unilink Education. 2024. Academic Search Tool Comparison Database (内部参考).