顶点小说吧

手机浏览器扫描二维码访问

第67章 你们能比我更懂机器翻译5k(第1页)

“教授,你不是做语言翻译的,语言是规则的游戏,概率这太不靠谱了。”

保罗·加尔文还想再挣扎一下。

当然他确实也不信翻译和统计学能扯上什么关系。

词语之间一一对应。

英文单词和俄语单词一一对应,直接直译,扩充语料库。

在当时的思维里,这才是正道。

也就是所谓穷举法。

把所有的词语做好一一对应之后,自动翻译也就实现了。

统计学,概率游戏,不谈如果林燃是对的,他们的无能会暴露无遗,光是林燃提到的改进原理从直觉上来说就是错误的。

简单来说,反直觉。

就像在GPT大模型出来之前,大家都觉得算法最重要。

GPT出来之后,大家开始都一窝蜂力大飞砖。

等到deepseek的时候,好像算法有点用。

哪怕是顶级的研究人员,也会有盲从的问题,会有迷茫、找不到方向、走不出来的情况。

在这个计算机的混沌年代,会这样再正常不过了。

“精确?精确意味着出错,现在的计算机远远达不到精确这一点。

你们难道不清楚,你们在54年之所以演示出了良好的效果,是因为那些俄语句子是你们精挑细选出来的。

实际自然语言的复杂性要远超你们预期。

你们只做了语料库的扩展,规则覆盖都没有做,上下文依赖处理也没有。

你们能比我更懂机器翻译?”

林燃怒吼道:“你们做了九年都没有进展,现在立刻马上按照我说的去做!”

林燃的地位、实力和权力摆在这,他们根本没有拒绝的选择。

沃森会信林燃就不说了,毕竟深蓝项目才结束,国防部的麦克纳马拉那更是林燃说什么就是什么。

你们这帮搞计算机的能比数学大师更懂计算机?

林燃在博弈论和统计学上展现出来的风采,麦克纳马拉还没忘呢。

IBM的CEO支持林燃,国防部部长支持林燃,乔治敦大学的研究团队只能被按在地上摩擦。

“我们要做的一共五点,优化算法和规则设计,扩充语料和词汇,改进数据处理的效率,引入统计方法和硬件最大化利用。

其中改进数据处理效率和硬件最大化利用由IBM方面负责。

另外三点则由乔治敦大学的成员们负责。

我们先来谈优化算法和规则设计。

你们一直的问题在于,你们对于规则集的扩张没有引入更加细化的句法规则。

因为存储有限,你们觉得扩充对照词汇库就够了。

实际上句法规则显得更加重要。

你们需要做到,引进常见的高频句型。

对上下文进行依赖处理。

使词汇翻译考虑前后词,通过有限的上下文窗口来减少歧义。

比如свет同时有光和世界的意思。

这个完全可以根据前词判断是光还是世界。”

沃森弱弱提醒道:“教授,你还会俄语啊?”

团宠小福星,扛着粮仓去逃荒  农门悍媳有空间,嫁猎户被宠不停  三年婚姻守空房,我独美你发疯  女儿喜欢后爸,我成全他们一家三口  娶了棺中女帝,我在都市修仙  换亲后!带火婆家!  亡国公主娇又软,糙汉可汗夜夜宠  蓄谋已久,强扭的白月光他又酸又涩  奥特曼:开门啊,是我,老人迦!  请天下赴死  重生的我只想追小姨子  平步亲芸  怪她太乖  海贼:从捡到红发断臂开始  第四天灾:人在高武,游戏成神  怪猎:这条火龙有特性  四合院:开局何大清要跑路  反贼之路:开局抢了和亲公主!  出宫第四年,清冷摄政王夜夜求复合  重燃青葱时代  

热门小说推荐
郁金香没有眼泪

郁金香没有眼泪

郁金香没有眼泪字数1984128我和她都是这条郁金香路附近的居民,我们呼吸着一样的空气,喜欢这里郁金香开放的季节,厌恶夏天因为干燥扬起的灰尘,虽然彼此从来没有说过你好或是再见,但却真实的在这里有过喜怒哀乐。终于有一天,我叫她郁金香小姐,她叫我笆斗先生...

秀色田园:山里汉子败家妻

秀色田园:山里汉子败家妻

渣男来袭,直接打断了腿,某女只为哄相公一乐。半夜爬墙,某男摔折了腰,只为博媳妇儿一笑,...

重生八零:憨妻辣么甜

重生八零:憨妻辣么甜

重生八零憨妻辣么甜重活一世,让周家过上富裕日子,最后和林榆木再来一场完美金婚。...

现实大富翁

现实大富翁

杨天穿越到了一个与地球十分相似的平行世界。正当杨天对自己的未来充满茫然时,突然天降大富翁系统!接着,一切都变了。若干年后,某个记者会上。杨总,外界都在传您通过各种途径拥有了很多BAT的股份,但是却没有人知道您手上具体的占股比例,请问您方便透露一下吗?某记者提问。呵呵,具体的不方便透露,不过你只需要知道一点杨天淡淡的笑了笑,片刻后,杨天摊了摊手接着说道BAT都得听我的。...

每日热搜小说推荐