Meta推出人工智能知识工具Sphere 适用于开放网络内容
Sphere的第一个用户是维基百科,它正在用它自动扫描词条,并识别其词条中的引文何时得到有力支持或没有支持。该研究团队已经开放了Sphere的源代码,它目前基于1.34亿个公共网页。
将Sphere用于维基百科的想法很简单:该在线百科全书有650万个条目,平均每月增加约17000篇文章。这背后的维基概念实际上意味着添加和编辑内容是众包的,虽然有一个编辑团队负责监督,但这是一项艰巨的任务,而且与日俱增,不仅仅是因为其规模,还因为其任务。
与此同时,监管维基百科的维基媒体基金会一直在权衡利用所有这些数据的新方法。上个月,它宣布了一个企业层级和它的第一批两个商业客户Google和互联网档案馆,它们使用基于维基百科的数据为自己的商业利益服务,现在将有更广泛和更正式的服务协议围绕它。
就Meta公司而言,该公司继续被公众的不良看法所拖累,部分原因是有人指责它使错误信息和有毒思想得以自由传播,所以推出Sphere这样的东西感觉有点像Meta公司的公关活动,如果它能发挥作用,也可能是一个有用的工具,就表明该组织中有人在努力真诚地工作。
今天关于Meta与维基百科合作的公告并没有提到维基媒体企业,但一般来说,为维基百科增加更多的工具,以确保其拥有的内容是经过验证和准确的,这将是企业服务潜在客户在考虑为该服务付费时想知道的事情。
目前还不清楚这项交易是使维基百科成为Meta的付费客户。不过,Meta确实指出,为了训练Sphere模型,它创建了一个新的数据集(WAFER),包括400万条维基百科引文,比以往用于此类研究的数据集要复杂得多。而就在五天前,Meta宣布维基百科的编辑们也在使用它建立的一个新的基于人工智能的语言翻译工具,所以显然这里面有联系在其中。