功能定位:为什么“导出自定义短语”仍是刚性需求
在星火大模型加持的 2026 版搜狗输入法里,AI 候选条已能根据上下文整句补写,但“自定义短语”依旧是最稳定、零延迟的“缩写→长句”映射方式。对医生、律师、客服等需要高频输入固定表述的人群,自定义短语相当于私人代码表;一旦换机或重装,重新敲一遍不仅耗时,更易出错。因此,把短语库导出为纯 txt 文件,既是合规备份,也是跨平台迁移的唯一可控通道。
与“同步用户词库”不同,txt 导出具有可读、可搜索、可版本控制三大优势:能被 Git 追踪、能丢进 Excel 做关键词统计,也能在任意编辑器里批量替换后重新导入。下文所有路径均以“截至当前的最新版本”为基准,若后续 UI 调整,可在同类菜单项中按关键字“自定义”“短语”“备份”定位。
Windows PC 端:三步直达 txt
1. 进入旧版属性窗口
状态栏搜狗图标→右键→属性设置→顶部标签切到【高级】→左侧找到【自定义短语设置】。这是搜狗沿用十年的入口,2026 版仍保留,未被 AI 实验室菜单合并。
2. 触发“导出”按钮
在弹出窗口的右下角可见导出按钮(若使用深色主题,按钮文字为浅灰,容易误看成禁用)。点击后,文件选择器默认定位到“文档”库,文件名自动带时间戳,扩展名只能是 *.txt。
3. 验证导出结果
用记事本打开,应看到每行一条记录,格式为:缩写词,排列序号=完整短语。若发现空文件,说明本地短语库为零;若缺部分条目,经验性观察:曾开启过“零云端模式”的账户,早期云端短语可能未拉回本地,需先执行一次同步用户词库再导出。
macOS 端:曲线救国方案
Mac 版搜狗至今未开放原生 txt 导出,但自定义短语以 SQLite 形式保存在 ~/Library/Application Support/SogouInput/CustomPhrase.db。可借助第三方 DB 浏览器打开,执行 SQL:
SELECT abbreviation, priority, phrase FROM custom_phrase ORDER BY abbreviation;
结果集复制到 Numbers 或 Excel,另存为 CSV 后改后缀 txt 即可。此做法未经官方认证,升级客户端时 db 结构可能变动,操作前请备份原 db 文件。
Android/iOS:先同步,后借用 PC 端导出
移动端菜单路径:键盘工具栏→S 图标→设置→词库管理→自定义短语,界面仅支持“新增/删除/排序”,无导出选项。官方逻辑是:短语随“用户词库”一起走云同步。因此步骤如下:
- 在手机端确认已登录同一搜狗账号,并打开【设置-词库管理-同步用户词库】;
- 等待通知栏提示“同步完成”(经验性观察:500 条短语约数十秒内完成);
- 回到 Windows 或 Mac(需装搜狗),登录同一账号,执行一次拉取同步;
- 按上文 PC 端方法导出 txt。
若公司电脑禁止装第三方输入法,可临时把短语同步到“搜狗输入法便携版”(官方绿色免安装包,解压即用),导出后删除文件夹即可,不留注册表。
txt 文件结构解析与批量改造
导出的 txt 为 GB18030 编码,若丢到 VS Code 出现乱码,需手动选编码。每行格式固定:
ts,1=谢谢老师! wj,2=我已经收到,稍后回复。
其中数字代表候选排序,越小越靠前。若你打算把短语迁移到另一输入法(如 Rime),可正则替换掉逗号与等号之间的序号,再转 YAML。反向操作亦可:把外部词汇表按上述格式批量拼成行,保存为 GB18030 编码 txt,再使用“导入”按钮一次性灌回搜狗。
导入回搜狗:版本差异与冲突策略
导入入口与导出同一窗口。若检测到缩写冲突,搜狗会弹窗提示“是否覆盖”,可选“跳过”“覆盖”“重命名”。经验性观察:若开启“零云端模式”,导入后短语立即写入本地库;若未开启,则先写本地,再排队上传,弱网环境可能出现“导入成功但云端未同步”,此时在另一终端会拉不到新短语。缓解办法:导入后手动点一次“同步用户词库”,确认通知栏出现“已完成”再退出。
不适用场景与副作用清单
- 短语含 emoji 或特殊 Unicode:导出 txt 可正常保存,但重新导入时老版本 Windows 客户端会过滤掉超出 BMP 范围的字符;请确保接收端也为 2026 版。
- 数量级超过 2 万条:导入过程会弹“词库过大”警告,虽仍可继续,但候选条弹出延迟肉眼可见;建议拆分为多个子文件,按场景导入。
- 公司电脑启用 Windows AppLocker:搜狗便携版若被策略拦截,将无法执行导入导出,需向 IT 申请临时放行。
故障排查:导出按钮灰色/同步后仍空白
| 现象 | 最可能原因 | 验证动作 | 处置 |
|---|---|---|---|
| 导出按钮灰色 | 当前登录账号与本地缓存冲突 | 切到【设置-账号】看是否显示“已登录” | 退出账号重新登录,或删除 %AppData%\SogouPY\users\acc_cache 文件夹后重启输入法 |
| 同步后短语仍空白 | 曾清空过“个人词库” | 查看【设置-词库管理-个人词库条数】是否为 0 | 无法回滚,只能重新手动添加或从旧 txt 导入 |
最佳实践速查表
- 每月最后一天执行一次导出,文件名带年月,放 Git 私有仓。
- 跨平台迁移优先用 PC 中转,避免 Mac 直连 db。
- 导入前先在接收端新建“测试,1=测试短语”确认功能正常,再执行批量导入。
- 2 万条以上拆包,单批 ≤5000 条,可明显降低候选条卡顿概率。
- 公司电脑受限时,用官方绿色便携版完成导出即删,减少合规争议。
FAQ - 结构化数据(FAQPage Schema)
导出 txt 后,手机端改了短语,如何合并差异?
需手动合并。建议把新旧两份 txt 按缩写排序,用 VS Code“按行对比”插件解决冲突,再整体导入,搜狗会以最后导入的版本为准。
是否支持自动定时导出?
官方未提供计划任务接口,可用 Windows 任务计划调用便携版命令行,但参数未公开,属于经验性观察;不推荐生产环境使用。
txt 文件能否加密保存?
搜狗本身不提供加密导出。可手动用 WinRAR 或 7z 对 txt 压缩并设置密码,再上传至云盘;导入前需自行解压回 GB18030 编码。
收尾:下一步行动
自定义短语 txt 导出看似小众,却是数据自主权的最小闭环。完成一次导出后,你不仅拥有了离线备份,还能用文本工具任意批量改造,为后续迁移到 Rime、微信键盘或其他办公平台打下基础。建议立即在电脑上执行一次导出,把文件连同其他配置文件一起纳入定期备份计划;下次换机或重装系统,只需 30 秒即可完成短语还原,真正做到“换一次设备,零重复劳动”。


