发现一个有趣的现象:用不同语言和 Codex 对话时,使用不同语言,搜索到的信息来源完全不一样。
在美国 VPS 环境下做的测试
简体中文对话 → 搜到知乎和 V2EX 等等 繁体中文对话 → 搜到英文期刊,繁体中文报道 日语对话 → 搜到 Zenn 这类日语论坛 感觉像是一个隐性的"语言围栏",对话语言直接决定了信息源的范围。
查了一下,这个现象在 AI 搜索领域其实已经有研究了,有人把当前的多语言 LLM 称为"伪多语者"( faux polyglots ),用户实际上被困在语言过滤泡泡里。还有研究显示,同样是西班牙语查询,在美国环境下只返回约 32% 的西班牙语来源,换到墨西哥 VPN 后直接跳到 63%。
所以如果想要更全面的结果,目前的 workaround 可能是直接用英语提问。
各位有类似的体验吗?