第473章 跑步进场“汇聚全世界的资源,分享你我他的快乐……”听着郑秋缓缓读出这条产品介绍,俞华忍不住砸吧砸吧嘴。“嗯!听着的确像是某种资源分享平台?”郑秋登时无语,翻着白眼指了指下面的一行小字。“这么牛逼的公司怎么可能这么肤浅!看下面!精选优质知识资源、促进教育方法改革、提升人才质量、推动智慧分享。弘扬中华文化,吸收世界文明。加快脚步迈入知识型社会——广大莘莘学子的福音!这格局……一听就大的没边了!”“某个相亲网站还喊口号说自己想促进人类繁衍,延续地球文明呢,大的没边谁不会啊?”“嗯……相亲网站?”郑秋狐疑的盯着面前的大龄光棍。“咳!这都是小细节,那什么,我们快点进去看看有没有什么惊喜吧,这可是白夜纪出品!唔……上面写着可以用天枢ERP或者八戒的账号进行同步完成注册,咱们都没有。如果是新用户,那么个人账号注册则需要实名认证,等会儿……”于是,注册……输入身份证号……绑定手机号……一番操作之后,俞华获得了一个初始账号。登陆之后,眼前立刻切换到了一个看着十分简洁的新界面。左边是个信息栏,除了自己的个人姓名和待编辑资料外,还有一个叫做“智慧币”的东西,目前数额为5。右边则是光秃秃的什么都没有,就一个孤零零的搜索框,背景则是白夜纪的机器人logo。“这东西怎么用?”“既然是知识类的分享平台,那应该是类似搜索引擎的东西,先输入一个搜索项目试试看。”于是俞华随手输入“人工神经网络(ANN)随机森林算法相关期刊论文”……这也正是他目前的研究课题。“刷!”只见界面一变。10篇相关论文及其简介就一项项出现在两人面前。“咦?还不错诶,上面头几篇都是这个领域引用次数较多,权重较高的权威论文……看!第10篇还是你去年的论文!”俞华惊喜道。郑秋抢过鼠标,点开自己那篇论文,果然,是自己写的没错,上面清楚的标注了著作人和发表时间。看着自己的作品,郑秋有些臭屁的点点头。“嗯!看来这个检索还是有些眼光的嘛!”俞华懒得搭理这个自恋狂,又点击下一页,继续查看检索顺序10~20的其他论文,果然又发现了好几篇熟悉的业内权威。一直到第100篇,几乎没有一篇是无效的“水文”。就这检索效率和效果,就绝不比蜘网来的差了。而且令人惊讶的是,别的网站通过期刊论文检索出来的,只要年份稍微久远点,一般都是图文版,也就是用相机扫描下来的。因为以前电脑普及度不高,论文大多还只是进行纸质存档的。就算后来电脑普及了,一篇篇重新机打出来也是一项异常庞大浩瀚的工程,所以只能扫描电子化进行存档。只不过,那清晰度就像是在对着电脑看旧报纸,很影响阅读体验。比如有一篇《随机向量学习模型》,他明明记得,在蜘网的检索数据库中它还是一篇扫描文档。然而这里显示出来的,却是清晰完整的电子档。就连文章中的表格和图文,也进行了高度还原原著的电子化重制,让人一目了然。就算是原作者看了,怕是也只能说一句“无懈可击”……“这帮家伙,该不是把旧的数据库文献全都给优化了一遍吧……”郑秋脑子里突然蹦出一个极为不可思议的想法。这种工程量,绝非少量人力可以完成,唯一的可能就是依靠自动化程序进行批量图文转换识别……如果真是如此,那这图文转换效果简直炸裂啊!“这东西说是还能查重来着,不知道效果怎么样……我试试看。”俞华没忘记自己原本的目的,当即从电脑里找出一篇已经审核过的硕士生论文,按照提示直接拖入对话框……【请问是否花费1智慧币进行查重服务?是/否】“原来要花站内币啊……1币一次,这样看来每个新用户都有5次免费查重机会?还不错。”俞华心里还是有些满意的。虽说不是完全免费,总比那些个上来就直接弹付款码的要好些。选择“是”,下一刻,画面上蹦出一个进度条。大概3分钟的功夫,进度条就缓缓拉到底,最终跳出来一个大号数字——重复率69.3%!“啥?69.3%?”俞华脸上有些错愕。“怎么啦?”“这篇论文我用蜘网查重过,最后结果是36.2%来着……喏,这是蜘网的查重报告单。”俞华从旁边的书桌上找了找,递过去一张打印A4纸。当蜘网查重系统在检测论文内容时,会将论文与自己的系统库进行比对。如果发现连续出现13个字符,也就是七八个汉字类似,就会判为重复,计算这部分重复率,最后将查重后的数据显示在最后的报告单中。同时还会在文本中以红色字体显示重复内容,并在重复区域旁标注出该段引用的相关文献。总的来说,蜘网虽然收费贵,但是就检索结果来说,服务还是比较到位的。郑秋看着手中的查重报告单,又看了看电脑上给出的69.3%的高重复率,皱了皱眉。“别的不说,就这查重速度,就快的有些匪夷所思了,该不是互联网算命……玩随机那一套乱给的吧?”刚刚那进度条,满打满算也不超过3分钟。3分钟,看似有些漫长,但相对规模庞大的文献数据库检索量来说,简直快到不可思议!要知道,蜘网的单次查重耗时一般为30~60分钟,在毕业高峰期间甚至会超过2个小时。相比之下,这样的“查重”耗时,多少显得有些儿戏了。什么样的运算速度和检索算法,能在这么短的时间内检索完那么庞大的文献库?“不可能吧……这么优秀的公司,而且人家也给了查重结果的。”俞华说着点开下方的“查重报告”按钮。下一刻,电脑前的两人都愣住了。画面上,这篇论文超过一半的地方都被红色标注了出来,旁边挂了引用文献和对应跳转链接。密密麻麻的根本不像是胡编乱造……“真的假的啊?”郑秋有些傻眼。他一把拿起那份蜘网的查重报告,开始逐行比对。“这个有,这个也有……嘶~全中!”蜘网检索出来的重复段落标注和引用文献,这里全都有,而且还贴心的给了文献链接,真假一目了然。那么多出来的这些……通过两人比对,得出了一个令人震惊的结论。那就是这个智慧树所检索的数据库……居然比蜘网来的还要全面!通常来说,论文查重系统的数据库,主要包括“学术期刊数据库”、“学位论文数据库”以及“互联网数据库”。这其中“互联网数据库”最为复杂,指的是大量的网页、博客、论坛等互联网信息资源。论文查重系统会将互联网数据库作为重要的对照,检测论文中是否存在互联网上已被公开发布的相似内容。“卧槽!对方哪儿来的这么庞大的数据库资源?”俞华不解道。下一刻他似乎是反应过来……“该不会,是爬虫程序吧?”国外有个牛逼的程序猿,靠着编写的强大爬虫程序,抓取了世界上超过6亿个网站的网络公共资源!最后就连骨歌、亚马孙、Adobe、ebay等互联网大厂,都前来寻求数据支持。一桌一椅一电脑。单枪匹马搞出了年营收1400万美元的夸张战绩!而整个公司仅有一个员工,堪称有史以来商业效率最高的企业!所以……会爬数据,也是绝对的高科技!“不止!你看,就连图表或者公式的抄袭……对方也能检测出来!”郑秋指着一串字符旁的标注震惊道。蜘网的检测技术是有缺陷的,部分“六六闪读 663d.com