| Contact Us | CHT | Mobile | Wechat | Weibo | Search:
Welcome Visitors | 登录 | 免费注册 | 忘记了密码 | 社交账号注册或登录

Home

温哥华资讯

Realty

Education

Finance

Immigrants

Yellow Page

Travel

DeepSeek是如何分析文本的,为什么有时会误解你

QR Code
请用微信 扫一扫 扫描上面的二维码,然后点击页面右上角的 ... 图标,然后点击 发送给朋友分享到朋友圈,谢谢!
参数量的增长,是为了覆盖更多知识维度。例如,一个14B参数的模型,存储了超过100种编程语言的语法规则;记忆了50万条常识知识;建立了10亿级的概念关联。


这样,等你向AI模型输入一句话时,它能根据自己的“知识”和参数,对这句话进行解析,去理解你的意思。

在实际的神经网络中:




以14B参数的模型为例,大约有40个这样的层;每层需要约3.5亿参数;加上词嵌入等其它参数,总数达到140亿。

参数越多,计算量越大,就越需要量化技术(如GPTQ、GGUF)来压缩参数,让大模型能在普通显卡上运行。

为什么7B模型比14B快那么多?这就像用精简版乐高套装(7B)和完整版(14B)拼模型的区别,参数越少运算速度自然越快,但细节表现力也会下降。

二、AI模型是如何解读用户输入的文本的

当用户在AI模型输入一段文本时,AI模型会对每句话进行解析,通过参数中的模式和关联来生成响应。我们举一个方言的例子:


他活像个五霸诸侯。

这是我家乡(河南省西南部)的一句方言,我不知道别的地方是否也有类似的说法。但我可以肯定,在网上不可能查到这样的方言用法。当地老百姓99%不知道他们日常所说的“wu ba zhu hou”怎么写。实际上,我从小到大一直困惑这个“wu ba zhu hou”到底是哪几个字,一直以为是“武霸猪猴”,形容一个人飞扬跋扈。一直到长大后才悟出来指的是春秋五霸,战国诸侯。

我告诉DeepSeek这是一句方言,但没告诉它这是哪里的方言。让它自己来分析。它是怎么分析的呢?它说:


假设这句话出现在山西/陕西方言中,模型的处理流程如下:

1、词语拆解与模式识别。即先把这句话拆解成很多语素,与自己的参数联系起来。



2、参数激活的“三明治结构”。


您的点赞是对我们的鼓励     已经有 3 人参与评论了, 我也来说几句吧
Note:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • _VIEW_NEWS_FULL
    _RELATED_NEWS:
    _RELATED_NEWS_MORE:
    共有 3 人参与评论    (其它新闻评论)
    评论1 zhaojie 2025-02-04 17:42
    chargpt离谱的更多
    Prev Page1Next Page
    _POSTMYCOMMENT:
    Comment:
    Security Code:
    Please input the number which is shown on the following picture
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西网为北美中文网传媒集团旗下网站

    Page Generation: 0.0340 Seconds and 5 DB Queries in 0.0015 Seconds