| 广告联系 | 繁体版 | 手机版 | 微信 | 微博 | 搜索:
欢迎您 游客 | 登录 | 免费注册 | 忘记了密码 | 社交账号注册或登录

首页

温哥华资讯

温哥华地产

温哥华教育

温哥华财税

新移民/招聘

黄页/二手

旅游

Token=词元 Prompt=文令…这些AI术语的中文名定了


请用微信 扫一扫 扫描上面的二维码,然后点击页面右上角的 ... 图标,然后点击 发送给朋友分享到朋友圈,谢谢!



本文来自微信公众号: APPSO ,作者:正在发出文令的

2012年,张一鸣给新公司取名,用了一个计算机术语做名字——字节。


这大概是中国科技公司里最让人服气的一个名字。两个字,有技术感,有力量感,认知成本几乎为零。你不需要懂计算机,只需要认中文,就知道“字节”说的是某种文字层面的基本单位。

干净、准确、过目不忘。能拿一个术语做公司名且毫无违和感,这本身就说明这个词翻译得有多好。

现在,“字节跳动”成了全球价值最高的独角兽公司。但要是问你:如果当年那家公司叫“存储单位跳动”,你还觉得那么自然吗?

别笑,这就是最近AI行业在发生的事。

别吵了,Token最好的中文翻译一直在那儿

上周大家对于Token该翻译成生什么吵翻天“模元”“智元”“灵符”“令牌”“偷啃”……社交媒体隔段时间就会掀起一轮争论,每次都以各说各话收场。

这些候选词各有各的巧思,但放在一起看,你会发现:大家都在比谁更有灵气、更有意境,却没人先问一个最根本的问题——Token在技术上到底是什么?

它不是“智能”的单位,不是“模型”的单位,它是语言处理的最小单位。


“灵符”有东方赛博美感,但术语不需要意境,它需要精确。

“智元”大气,但Token是语言的处理单位,不是“智能”的单位,往上贴“智”字是贴错了标签。

“令牌”最离谱,这是Token在计算机安全领域的既有译法,特指身份验证凭证,拿来混用等于把银行卡和扑克牌叫同一个名字。

“偷啃”这种音译就完全丧失了中文的优势了。


其实在这场混战之前,答案早就在那里了。

在自然语言处理(NLP)学术文献里,Token作为文本的最小处理单位,长期被译为“词元”。

词,指向语言属性;元,指向最小粒度。两个字,一个管归属,一个管层级。

苹果就采用了这个译法。打开Apple中国官网,产品详情页写着“词元响应速度”。



要知道苹果的中文本地化团队是出了名的较真——AirDrop叫“隔空投送”,Live Text叫“实况文本”,每个词都是反复推敲的结果,目标只有一个:准确、简洁、有造词美感。

苹果选了“词元”,绝不是心血来潮。无独有偶,在央视新闻节目里,Token同样被译作词元。
您的点赞是对我们的鼓励     这条新闻还没有人评论喔,等着您的高见呢
上一页1234下一页
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
    猜您喜欢:
    您可能也喜欢:
    我来说两句:
    评论:
    安全校验码:
    请在此处输入图片中的数字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西网为北美中文网传媒集团旗下网站

    页面生成: 0.0263 秒 and 5 DB Queries in 0.0020 秒