Venter 的预测只是基于相对较少的人群。通过机器学习技术,数据集越大,结果越好;与数以万计的基因组结合,可以大大提高预测速度。

生物学家 Graig Venter 是生物公司 Human Longevity 的老板。这家位于圣地亚哥的旨在建造世界上最大的基因组数据库的公司。上世纪 90 年代末,Graig 宣布,国际上通过公共资助的项目对人类基因组进行排序的组织方法是错误的,他开发了一种更便宜且更快的方法。

Human Longevity 已经收集了 45,000 个基因组,其中大部分来自于参加了与特定身体特征相关的临床试验的实验者。该公司利用机器学习工具分析这些数据,然后根据基因序列预测身体特征。现在这项技术已经提高到,公司根本不需要看到一个人就能生成他的照片。

从基因组中创建照片有很多潜在的用途,尤其是在法医科学领域。从罪犯遗留下来的任何遗传物质 (如血液或体液) 中,也许可以重建罪犯的面孔。这将让警察在谋杀、故意伤人和强奸案件中「看到」嫌疑犯的面孔。它还可以帮助识别被烧伤或致残到无法辨认的受害者。如果仍有合适的基因样本留下,那些尘封的悬案可能会重见天日。

人脸不仅仅能表明身份,它还显示了许多其他信息,同样能由机器读取。这也带来了一些其他益处。

Face2Gene 是 FDNA 公司开发的智能手机应用。FDNA 公司是由 Moti Shniberg 和 Lior Wolf 共同创立的一家位于波士顿公司。Shniberg 之前从开发了一个识别上传至社交媒体网站的照片中的人的标记算法,被 Facebook 收购了。FDNA 应用程序允许医生拍摄病人的照片,并将其上传到互联网(连同患者的身高、体重和临床数据),让 Face2Gene 的算法从其在线数据库中索引,生成一份可能的疾病清单。该应用可以访问 10000 种疾病的信息;到目前为止,面部识别可以预测其中 2500 种。