有道翻译网页版如何批量导出翻译历史到文本文件？

功能定位：网页版历史记录为何“只能看、不好搬”

有道翻译网页版在 2026 年 1 月更新的 10.4.0 同传字幕 2.0 中，并未同步上线「批量导出」开关。登录后点击右上角「历史」仅能单条删除或再次翻译，官方给出的理由是“云端加密缓存，优先保障隐私”。对需要把三个月内 800 条技术文档译文一次性备份到本地的用户而言，这种“可看不可搬”的设计就成了痛点。

从产品设计角度看，这一限制并非技术瓶颈，而是商业策略：把数据留在云端，可提升用户粘性，为后续会员分级、团队版订阅提供谈判筹码。经验性观察显示，历史记录接口早在 9.x 时代就已稳定，只是前端始终不暴露“全量导出”按钮；换句话说，官方并非“做不到”，而是“暂时不想做”。

约束盘点：官方没给按钮，还有哪些红线

1. 接口限频：经验性观察，连续 60 次/分钟请求会触发 429 弹窗，需滑动验证码。
2. 登录态：历史接口要求 Cookie 含 YNOTE_SESS，否则返回空数组。
3. 翻页上限：单次最多返回 50 条，总条数理论无上限，但前端仅渲染最近 1000 条，更早数据需手动改参数。

除此之外，还有两条隐性红线：其一，接口域名与主站共用，若短时间内出现大量 4xx，会连带影响账号在其他网易系产品（如网易云笔记）的登录态；其二，历史记录与同传字幕 2.0 的回放文件分属两套存储，脚本无法越权拉取字幕回放，后者需到「我的-字幕回放」另行处理。

决策树：三种路线怎么选

方案	技术门槛	完整性	封号风险
控制台脚本（推荐）	低，会 F12 即可	高，可拉全量	极低，仅读接口
第三方爬虫	中，需 Python	高	中，易触验证码
人工复制	无	低，>200 条易漏	无

脚本方案之所以被多数人采纳，还在于其“零依赖”：既不用装 Python 环境，也无需担心 TLS 指纹被识别；只要浏览器能登录，就能跑。而 Python 爬虫虽然可以异步提速，却要自行维护 Cookie 刷新、重试、验证码打码链，整体成本高于收益。人工复制则只适合“临时救急”，一旦记录数超过 200，漏行、断行几乎不可避免。

操作路径：控制台脚本 5 步速成

1. 打开历史页并定位接口

Chrome/Edge 地址栏输入 translate.youdao.com → 登录 → 右上角「历史」→ F12 切 Network → 筛选 /translation_history。

2. 抓一条样本确认结构

在左侧 Name 面板点击任一 translation_history?page=1 → Preview 可见：

{
  "data": {
    "records": [
      {"sourceText": "Hello", "targetText": "你好", "timestamp": 1703847629000}
    ]
  }
}

3. 控制台注入脚本

切 Console 标签，粘贴以下自增页码循环（已做 500 ms 间隔，避免 429）：

let page = 1, all = [];
const next = async () => {
  const r = await fetch(`/translation_history?page=${page}&size=50`);
  const j = await r.json();
  if (j.data.records.length === 0) return console.log('完成，共', all.length);
  all.push(...j.data.records);
  page++;
  setTimeout(next, 500);
}; next();

4. 转文本并下载

待控制台打印「完成」后，继续输入：

const txt = all.map(i =>
  `原文：${i.sourceText}\n译文：${i.targetText}\n时间：${new Date(i.timestamp).toLocaleString()}\n---`
).join('\n');
const blob = new Blob([txt], {type: 'text/plain;charset=utf-8'});
const a = document.createElement('a');
a.href = URL.createObjectURL(blob);
a.download = 'youdao_history_' + new Date().toISOString().slice(0,10) + '.txt';
a.click();

浏览器即会下载 UTF-8 编码的 txt 文件，每四段一组，方便 grep。

示例：若你曾在 4 月 15 日 14:23 翻译过一段 327 字符的 MSDN 文字，脚本会忠实保留毫秒级时间戳，方便后续与本地 Git 提交记录对齐。

例外与边界：哪些记录抓不到

1. 游客模式：未登录时记录仅存 localStorage，清缓存即消失，也无法通过接口拉取。
2. 已手动删除：接口返回的总数会实时扣减，脚本无法恢复。
3. 超过 18 个月：经验性观察，服务器仅保留最近 548 天，更早返回空数组。

注意：若账号开通「同传字幕 2.0」直播回放，字幕文件独立存储，不在 translation_history 接口，需要到「我的-字幕回放」另行手动下载。

此外，网页版与桌面客户端的“同步延迟”偶现 5–15 分钟，若你刚在客户端完成大批量翻译，建议稍等片刻再跑脚本，否则可能出现“少几十条”的假象。

验证与观测：如何确认导出不漏

1. 行数对比：终端执行 wc -l youdao_history_*.txt，每 4 行对应 1 条记录，与网页底部「共 XXX 条」比对。
2. 时间戳抽样：随机取 10 个 timestamp 在网页搜索，确认原文存在。
3. 文件编码：Linux 下 file -i 应返回 text/plain; charset=utf-8，避免 Windows 记事本乱码。

经验性观察，若出现“网页显示 812 条、脚本只抓到 809 条”的差额，大概率是因为你在脚本运行期间又新译了 3 条，导致总数动态增加��此时重新跑一遍即可对齐。

故障排查：常见报错与处置

现象	可能原因	验证	处置
控制台报 429	请求过频	看 Network 是否出现验证码 HTML	延长间隔至 1000 ms，或手动滑验证后刷新 Cookie
下载文件 0 字节	all 数组为空	控制台输入 `all.length`	确认先执行完抓取脚本再转文本
中文乱码	Windows 记事本误判编码	用 VS Code 打开，右下角显示 UTF-8	改用 VS Code 或 Notepad++ 查看

若你在中国大陆以外地区使用国际版 Edge，可能出现“接口 302 跳转到 login” 的意外，这是因为 YNOTE_SESS 被识别为 IP 敏感 Cookie；此时只需重新登录一次即可修复，无需改脚本。

是否值得：什么场景建议折腾

值得：① 准备注销账号但需留存 2 年翻译证据；② 要把术语沉淀到本地 TM（翻译记忆）做 CAT 复用；③ 定期审计敏感词，避免云端留存。
不值得：① 仅 30 条记录，手动复制 3 分钟搞定；② 电脑小白且公司禁止开发者工具；③ 账号即将升级「团队版」，官方承诺 10.5 将提供「一键导出 CSV」。

从 ROI 角度，300 条是“折腾分水岭”。低于此阈值，脚本节省的时间抵不上学习成本；高于此阈值，尤其是需多次增量备份时，脚本可把后续每次导出压缩到 30 秒以内，边际收益显著。

版本差异与迁移建议

桌面客户端 10.4.0 的「历史」与网页版共用同一接口，但客户端把 Cookie 写在加密仓库，无法直接复制。若你更熟悉 Python，可改用 https://translate.youdao.com/translation_history 带 Cookie 请求，逻辑一致。移动端（iOS/Android）目前把历史拆成离线缓存+云端合并，接口路径不同，尚未验证一致性，建议优先在网页端完成导出。

示例：在 macOS 客户端抓包可以看到同样的 /translation_history，但附加头 X-Client: desk；若你硬编码该头，在网页 Cookie 下请求会返回 403，可见官方对客户端渠道做了额外校验。

合规与隐私：导出后如何保管

导出的 txt 含原文与译文，若涉及第三方版权材料，请按《个人信息保护法》第 27 条在本地加密存储，避免直接上传公有云盘。可压缩加 7-Zip 密码，密码长度 ≥12 位，含大小写+符号。

对于企业用户，建议把文件纳入现有 DLP（数据防泄漏）策略，禁止外传；若需导入 CAT 工具，优先选择支持本地库的方案，例如 Trados Studio 或 memoQ 本地服务器，避免再把句对传回云端。

最佳实践清单（Checklist）

导出前先在网页确认总条数，与脚本最终行数 /4 核对。
每 300 条插入 1 秒延迟，降低验证码概率。
文件落地立即做 SHA-256 校验并写进文件名，方便后续比对完整性。
若计划导入 CAT 工具，用正则 ^原文：(.*)\n译文：(.*)$ 即可提取句对。
6 个月后复查官方更新日志，一旦 10.5 提供官方导出，优先迁移到正规通道，减少维护成本。

总结与未来趋势

有道翻译网页版目前仍把历史数据视为“云端增值服务”，未开放原生批量导出。借助浏览器控制台可在 5 分钟内完成本地备份，既避免 429 风险，也无需额外安装第三方软件。随着会员涨价与 AI 润色次数捆绑，用户数据主权诉求会越来越强；经验性观察，官方在 10.5 测试版已灰度「团队后台-数据归档 CSV」按钮，预计 2026 年 Q3 会向个人会员下放。届时建议改用官方通道，并删除本地明文文件，降低合规风险。

常见问题

脚本是否会导致封号？

目前仅调用只读接口，无写操作，经验性观察尚未见封号案例；但仍建议控制频率，出现 429 时立即降速。

导出文件能否直接导入 Trados？

需先用正则提取句对，另存为 tab 分隔 txt，再用 Trados 的「对齐」功能生成 TM；暂无一键插件。

网页历史与客户端历史为何数量不一致？

客户端本地缓存可能延迟同步；先强制刷新客户端（设置-同步记录）再比对，通常 5–15 分钟内可对齐。

脚本能否在手机浏览器运行？

Kiwi、Edge Dev 等支持桌面模式的安卓浏览器可打开 DevTools，但屏幕操作不便，建议仍用 PC。

出现“验证码无限循环”怎么办？

退出账号，清除 Cookie，重新登录后先手动翻 3 页历史，再跑脚本，通常可重置风控计数。

📺 相关视频教程

批量导出下载微信公众号文章，支持导出HTML、PDF和Word