这个测试很快就结束,随着测试结果的出炉,在一旁用来比对的数据也开始显得非常渺小。
这个测试分为了许多项的分数,有中文理解能力测试,数学逻辑正确测试,还有英语理解能力测试。
其中美丽国的Goal-AI-4o在此款测试软件中得分并没有多少。
因为这个软件采用的是非常严苛的算法。
一些测试用例的答案都必须偏人性化思考才能取得答案。
这才造就了任何一款AI测试得分比较低的缘故。
他国的AI基本上每一项能力的测评基本上只有50分左右。
而且美丽国的AI中文理解能力在这款软件之中得分也是偏低,只有30多分。
而林宇上传的这款AI在其他模型的面前就凭着得分的直条统计图。
就像一座大山一样,稳稳压着它们。
只见界面上写着。
得分(本次结果已经联网上传):
中文理解能力测试100分,数学逻辑正确测试100分,还有英语理解能力测试98分。
林宇不清楚为何英语理解能力为什么会差两分,可能是题目统计的缘故。
随后他接着再测试两遍。
发现程序到现在为止分数依旧是如此。
就算平均分三次都是同样的分数得出来的也就是原来的分数。
只有英语理解能力有略微的差异,不过平均得出来的也是98.5分。
他看着破天AI的后台界面,想到降级后的AI。
这都能直接横扫其他公司开发的AI,原来AI的本体到底是有多强啊。
而此时,在美丽国AI测评协会之中。
一位身穿西服的黄皮肤的小伙子坐在办公室中不断端详着桌面的报告。
在别人一眼看去就知道他是亚裔。
这位正是我们龙国公费外派出去留学之后不回来的人士之一刘能。
他看着桌面上的特殊报告也是皱起眉头来。
“这是我们软件的bUG?”
他喃喃说道,自己的心中也拿不定主意,随即立刻拿着报告给自己的上司发过去。
发送过去之后,自己又开始端详起来。
“连续三次都是得一百分???只有英语才有波动98.5分?”
很快,他就想到一个可怕的事实。
因为在AI测试的过程之中。
多次的测试,每一次测试的分数定然是不相同的。
如果AI每次测试相同的情况下,而且还是100分。
就说明这个AI原本得的分数应该是远远超过100分。
100分则是他们测试软件的极限,不是被测试AI的极限。
当然,那个人能坐上那个位子自然也不是蠢的。
很快他就想明白了一些道理,背上的冷汗直流。
“难道他们刚刚建立起来,投入几千亿美金研发的AI,甚至都不如龙国的这个AI?”
当然他也只是担心自己的位置不保,根本不在乎美丽国AI界投入资金的损失。
要是被美丽国财团知道这个事情,他只是位置不保,而他的领导则是人头不保。
“嘟,嘟,嘟——”
桌上的座机电话响起。
他接起之后,一副带着伦敦腔调的声音传来,“米斯刘,这到底是什么情况?这是真的还是假的?”
“一般来说按照正常情况来讲,应该是真的,我到时候去排查看看是不是软件出了什么bUG。”
“马特法克,这龙国是不要命了吗?这肯定是用国家级别的超频跑出来的成绩,要是这成绩是真的话,可能得领先我们超过十年了。”
“好的,我这边尽快查查,重新搞一份报告给你。”
刘能说完这句话也是一脸嫌弃的挂断电话。
头上的领导就是这样,让不懂技术的人来管懂技术的人。
刘能也不能有任何怨言,他肯定知道,龙国技术肯定是有突破的。
如果光凭借算力就能拔高AI智能程度的话。
那大家直接花钱堆算力就好了,何必要去开发那些内容。
这么简单的逻辑刘能也是不指望这个领导懂了。
不过他也很好奇。
上传的报告来自龙国,龙国的技术到底是如何进步的。
林宇这边,柯尘羽被他叫到办公室中。
此刻柯尘羽坐在办公室的椅子上,神情呆若木鸡。
“这......这是我们公司开发的AI?”
“不然呢,事实不是摆在你的面前了吗?”
柯尘羽来到这里的时候,同时又对当前这个AI进行了一定次数的测试。
到现在也才确定下来,面前这个AI确确实实是有这个能力。
随即柯尘羽立刻站起身来,对着林宇说道,“下面搞一个AI部门让我来负责吧,你说如何?”
“我一定能尽心尽力的完成AI后续开发提升......”,柯尘羽说到这里,声音变得越来越小。
他一想到这么先进的AI是林宇自己一个人搞出来的。
心中的郁结之气也是更加浓郁。
自己仅存的一点对了解AI的优越感荡然无存。
“好吧......话又说回来......这个AI的运营我是能完完全全负责起的!!!”
林宇看着柯尘羽从欣喜,到兴奋,再到突然意识到什么而失落的时候,也是忍不住的笑了出来。
“你这...吹牛都不敢吹,我到时候部门怎么放心的交给你?”
柯尘羽听完之后挠挠头,“你懂的,我是一个老实人。”
“行吧行吧,去吧,你先去做一个我们AI的宣传视频随后发给我看看。”
“好嘞义父,我的运营能力,你就瞧好了吧。”,柯尘羽一脸激动的朝着自己的工位上奔去。
他当然是抱着学习的心态,去了解林宇开发的这个AI。
他心中一想到自己能参与AI的运营,再怎么不行,还是可以看到AI的源代码的,无论如何,他都想学学其中的技术。
林宇看着柯尘羽的背影,心里想了想,这才叫做真正高级的牛马,即便不用催促,都能实现自我激励。
而在美丽国那边,刘能开着电脑不断地查看那份详细的报告。
这才发现,原来是自己开发的程序出错了......而不是对方的AI有错误。
他看着英语测试用例之中,有三千多个用例和理论上真实的答案完全对不上。
而扣掉的这些分,全是抽取到错误的英语测试用例。
他现在有点头皮发麻,他对这款AI的报告也是无从下笔。
思索良久,他这才在报告下方评价之中,写下一行字。