第三百零一章 智能搜索引擎

当天下午,一个又一个黑华文编程语言的自媒体被挖了个底朝天,然后一堆律师函就送到了他们的家门口。

由于事态的发展越来越严重,当天不少警方出动,再加上网上的一些nèimù爆料,大家这时才发现,这些家伙文章里看似拽了几个专业术语好像很懂的样子,结果一看自媒体人的履历,跟计算机行业压根没有半毛钱关系。

有好些个还是刷号的,手里一堆号,啥都写,天文地理八卦娱乐,什么都写,其实什么都不懂。

那他们是这么拽出那么些个专业术语,又怎么感觉好像黑的还有点道理的呢?无非就是到网上去搜点专业名词,大概了解一下这个东西,然后就开始瞎掰。

但是因为像华文编程语言这种东西属于小众的东西,就像之前说,大家都习惯用英文了,几乎没有人想过要改成华文,但小众的同时又是技术含量很高的东西,更没什么人会去网上探讨这个话题。内行人都在私下沟通呢,谁没事跑网上去瞎探讨。

所以一上网搜,搜到的内容本身很多就是瞎掰的,再加上造谣者本身的瞎掰,把原本就瞎掰的东西拿来整理一下,搞成了一篇看似很高大上的技术类文章,其实就是瞎掰上瞎掰,所以很容易就被专业人士给拆穿。

但因为造谣者其实并不懂,也就无法分辨网上那些东西是不是瞎掰,总之能说出点道理就完了,本来就是为黑而黑,真的让他们去好好研究技术,他们才没那功夫,也没那脑子。

更搞笑的是,这些还愿意去整理一下的自媒体都算好的了,还有一些自媒体就是看到别人发的,直接拿来抄,改几张照片,前后改几句话,就变成自己的内容了。

所以这是包含了自媒体的原创瞎掰,自媒体的抄袭瞎掰,还有网上随处可见的瞎掰,就暴露了两个问题,第一,在网上的造谣成本太低,开局一张图,内容全靠编。还有一点就是,这么多瞎掰的内容就这么在网上散布着,压根没人管。

相信大家肯定看得到过类似赵云是丞相,乾隆是私生子之类的文章,有依据么?有个锤子,就是瞎掰啊,可各种各样的瞎掰就这么在网上摆着,当有人真的想去了解的时候就很容易获取到错误的信息。

但瞎掰历史人物的影响可能还潜移默化一点,但像瞎掰木龙科技,瞎掰华为,瞎掰一些当代人的影响可就直接的,真的有时候就因为某些人的几句瞎掰,就把一个人的努力全打压了,就活生生的毁了一个人或者是一个企业。

这年头,大反转的诬陷瓜网友们也吃了不少了,可还是有很多人喜欢造谣,实在是可恨又无奈。

当天晚上,网上关于反制造谣的声音一浪高过一浪,对华文编程语言的造谣神奇了成为大家对造谣厌恶的导火索,不断放大。

而这一晚,木龙科技灯火通明。

第二天中午,刘凡正在办公室吃饭,有人敲响了办公室的门,网上的事情他也都看到了,但事情闹成这样,这么多人为自己打抱不平,他反倒没想好自己该这么表态。

推门进来十八人,都是木龙科技目前算法、系统等部门的顶梁柱级人物。

为首的正是当初刘威带刘凡在燕京见的燕大教授徐飞鸿,“刘总,我们想来申请推出一个产品。”

“什么产品?”看着眼前这架势,刘凡已经知道这事不简单了。

“智能搜索引擎。”

“智能搜索引擎的几个难题你们都解决了?”

智能搜索引擎是木龙科技的一个储备技术,当初本以为可能要跟谷歌刚的时候,木龙科技就投入了大量人力财力研究智能搜索引擎,但当时的技术和人才情况下做出来的智能搜索引擎并不完美,后来跟谷歌达成了深度合作,这个智能搜索引擎项目就作为了一个长期储备项目在不断优化中。

但想做智能搜索引擎难度还是很大的,因为要解决现在搜索引擎的一些主要问题,比如说现在大家想搜一个东西的时候经常搜出来的根本不是自己想要看的,且不说他的广告竞价导致一大堆广告,就算是没有广告,因为现在度娘是以关键词作为匹配信息的,再加上他内部的权重机制,导致用户经常搜非所找,而且经常前几页搜出来的信息都是一模一样的,无非就是发布的网站不一样,这就搞得大家很头疼。

还有一个问题就是上面提到的,信息真伪度无法辨别,现在的搜索引擎只管搜索基本无法做到信息审核,只要不涉及三个进取,啥都能放出来,所以大家经常可以搜出假信息,尤其是一些小众的知识点,只要有人造谣,然后你可能就按照造谣者说的去理解了。

但这个问题又很难解决,因为信息本身的真伪辨别需要一个强大的评判系统,可是很多东西可能连专家都判断不出真伪,人工智能如何保证,还有抄袭问题,现在度娘上为什么雷同的内容那么多,大家都在抄袭,再加上权重机制导致了关键词左右了搜索结果,用户就很难看到更多的信息,除非不断往下翻。

就像以前在淘宝上买东西,想买衣服,看了一件衣服之后,后面全部都推荐类似的款式,可问题是,我挑衣服的目的就是为了可以看到更多的款式啊,你清一色给我推一样的款式,我还挑个屁啊。

可如果要改变这种极致首先就得有办法找出谁是原创,但这也很难,因为如何判断原创呢,就算是第一个发布的人都不一定是原创。

当然,还有无效信息太多,很难判断信息的有效与无效性,以及信息更新速度慢,时效性等常见问题。

要解决这些问题,一方面是改变机制,一方面的话增加交互也能改善,如果有智能交互计算机就可以更清楚的了解到用户到底想看什么,这样可以更准确的为用户提供所需要的信息。

可这里就又有一个问题了,这对芯片的智能性要求就高了,也就是说要设计出高ai性能的电脑芯片,价格就上去,可电脑的智能化一直都是一个发展缓慢的领域,毕竟大家用电脑就那么点事情,看电影,打游戏,办公,需要智能的地方太少了,总不能为了智能而智脑,搞点人脸识别开机什么的吧,所以搞这样的智能搜索引擎,整个电脑行业的性价比问题这么解决。

所以智能搜索引擎研究了这么久,木龙科技都没有推出,因为这东西做出来简单,要做好很难。

徐飞鸿没有回答,而是把一份文件摆在了刘凡的面前。

刘凡快速浏览了一遍文件,33套信息处理方案,287个Pc应用智能方案。

在33套信息处理方案中,改变搜索机制就不提了,关键是都对信息的排查提出了建设性意见,最被推荐的一套六段过滤法,将信息进行分层的智能分析,从第三段开始,还会涉及到人工审核,同时,对信息进行了不同的标注方式。

用户在搜索信息的时候,就可以看到这个信息是官方发布的还是个人发布的,这个信息是否有参考来源,这个信息是否仅供参考,或者这个信息存在误导风险等等合计100多种标注方式,至于那些确认了的虚假信息,则会直接被打上造谣的标签。

另外,对于造谣者,系统直接与警方链接,人工智能不能百分百确定信息发布者是否造谣,但可以把信息交给警方由警方进行下一步行动,一旦确定造谣,会对该造谣者发布的所有信息贴上警告标签,当然,转发者不会受到这种待遇。

但对于抄袭者,木龙科技会提供抄袭质疑系统给各个平台,比如同一账号下多个内容都涉及到抄袭嫌疑就会进入人工审核,然后进入人工质疑等环节,如果确认恶意抄袭,那等待他们的也会有特定的标签,以及严重者也会受到法律的制裁。

当然,也许法律制裁的后果并没有那么眼中,但随着实名认证的普及,未来对于诸如造谣者来说,将来所有的言论都将在木龙科技的搜索引擎内被贴上警告的标签并且被系统纳入重点观察对象。

想要在线上继续敛财,或许就没那么容易了。而且在方案中还考虑与阿里的征信系统合作。

“会不会太狠了点,造谣一次就影响一生。”刘凡有意无意的问了一句。

“狠?他们造谣的时候有没有想过,被他们造谣的受害者会受到什么样的伤害?这些年因为造谣家破人亡甚至轻生的新闻还少么?这些年因为造谣导致的社会问题还少么?

觉得狠,丫别造谣啊!”

刘凡看了眼情绪激动的徐飞鸿,做了个冷静的手势,“你的想法我能理解,先不说这个,你们这些方案我看了,有些确实还挺成熟的,你们花了多少时间研究出来的?”

“一晚上。”

刘凡看着徐飞鸿一脸疑惑。

后者接着解释道,“昨天晚上,木龙科技一万多名编程人员共同参与头脑风暴,这是大家共同研究的结果。”

刘凡:“...”

这么野的么...