首页 > free movies >顶尖竞争者爆炸五角大楼的新DNA奖
2018
03-15

顶尖竞争者爆炸五角大楼的新DNA奖


争夺国防部DNA分析100万美元奖金的科学家们正在大声疾呼。前10名竞争对手中的几位负责人指出,用于检测DNA样本中的生物恐怖威胁的防御减少威胁机构(DTRA's)算法挑战的规则和得分尚不清楚。当提交期在7月14日结束时,103个“解决者”中的3个(包括个人和团队)已经进行了最终裁减,现在他们的计算机程序将在最终评估中得分。

生物信息学博士David Ainsworth说:“他们组织比赛的方式和他们得分的方式非常可怕。伦敦帝国理工学院的学生,他的团队仍然在争夺奖项。

主办单位承认比赛非常艰难,并说找出设置酒吧的位置非常棘手。 “挑战赛的项目经理克里斯蒂安惠特彻奇说:”你不想让它如此之高以至于没有人能够获胜,但是你不想把酒吧设置得如此之低,以至于你有200人并列第一名。三支球队取得成功的事实让他乐观地认为,最终产品对政府来说非常有用。

但是一些参与者说评分系统不必要的复杂,并不能反映他们工作的质量。生物信息学家,马里兰州巴尔的摩约翰霍普金斯大学的生物信息学家Steven Salzberg说:“就我所了解的比赛目标而言,我认为最好的算法不可能取得胜利。”他没有参加,但在他的实验室里看到两位科学家 - 一位博士。学生和生物信息学工程师 - 几乎错过了这一切。

1月,负责广泛安全任务(包括试图发现和避免可能的生物恐怖威胁)的五角大楼机构DTRA提出了挑战:找到一种更快更准确的方法来鉴定物种和基因未加工的DNA。随着DNA测序变得越来越快,越来越便宜,DTRA希望这一挑战能够激发出高度精确的计划,在不到一个小时的时间内检测到DNA样品中潜在的危险生物,这是对当今能力的巨大改进。

为了管理比赛,DTRA选择了InnoCentive公司,该公司代表“搜索者”主持线上挑战,并接​​受来自全球潜在“解决者”的提案。这是DTRA迄今为止提供的最大奖项,它代表着该机构开展业务的正常方式。惠特彻奇说,通过接受任何在线注册的人的参赛作品,DTRA希望能够吸引不同群体的科学家的知识,而不需要招标和签约过程的繁琐手续。

对于参与者来说,参与竞争需要预先投入高风险时间,但它也消除了授予流程的传统障碍。德国蒂宾根大学的生物信息学家丹尼尔胡森说:“拥有真正解决问题的技巧,并有能力编写一份提案来获得资金 - 他们是两种不同的技能组合,”他是德国蒂宾根大学的生物信息学家, 。受到百万美元奖金的影响,约有2700人报名参加了挑战赛,其中大约一半来自美国,其中103人提交了报告。胡森和他的队友们放弃了一切,为这个项目投入了17个小时的时间,但他表示气氛令人振奋,目标值得。

参赛者收到9个数据集,每个数据集都包含来自不明来源的遗传密码组合;他们的工作是设计一个生物信息学程序,以识别混合物中的生物体并描述其个体基因。他们将结果提交给自动评分系统,该系统发回的准确度读数介于0和100之间。要获得评估轮次的资格,他们必须为9个数据集中的每一个获得最低分数。

参与者Derrick Wood从一开始就不清楚他的计划的答案应该如何具体以及他们如何得分。伍德,计算机科学博士。没有资格参加评估的马里兰大学学院的学生说,在某些情况下他没有提到有机体的菌株,但在其他菌株中添加菌株信息时没有获得额外的分数。在要求澄清他应该使用哪个基因数据库作为参考之后,参赛者罗伯特 自费资助的计算生物学家埃德加说,他在DTRA的电子邮件通讯中被告知,一个名为RefSeq的数据库是公平的游戏,但后来发现使用它遗漏了关键信息并降低了他的分数。埃德加,也刚刚错过了削减,说DTRA是通过定期电子通讯解决问题模糊。

为了检查他们算法的效果如何,参与者可以重复提交他们的得分结果,但每月提交的提交数量有限,而且一些参赛者报告说评分算法充满了错误。埃德加回忆说,该系统已脱机,然后在排行榜上以完全不同的得分重新出现。安斯沃斯说,依靠这个神秘的数字分数将挑战转化为逆向工程的练习。 “我们花了上个月试图让[算法]算法告诉我们,我们做得很好,而不是真正做出正确的科学来产生好的结果,”他说。

因为在挑战的前4个月内没有人合格,DTRA放宽了一些规则。它将原来的5月31日截止日期推迟到6月30日,删除了两个所需的数据集,提高了参赛者提交评分结果的次数,并降低了准确度要求。随着参赛者继续奋斗,截止日期再次碰撞到7月14日。惠特彻奇说:“我承认,当我们只有一个月的时间,没有人达到门槛时我很紧张。

在截止日期前不到一周,与会者收到一封电子邮件,鼓励他们合作提高分数。安斯沃思说,在过去的24小时内,球队之间出现了一阵惊心动魄的电子邮件,他得到了五次这样的邀请,并与另一位单人竞争对手合作。新组建的团队可以使用不同数据集上的不同算法的输出,将结果交换成合格的得分。 “这只是一种完全人造的游戏系统方式,”埃德加说,他认为合格的算法可能并不比被拒绝的算法更好。

这三个限定符现在已经上传了所有的代码,以便在评估中进一步测试。这是第一次,速度将在竞争中发挥作用,因为程序会在原始数据集和全新的DNA样本上正面交锋。 Whitchurch说,如果没有团队达到要求,那么有可能会考虑一些被取消资格的人。

即使是合格者也不能确定他们的工作是否符合原始要求。安斯沃斯和他的队友调整了他们的算法之一,但不知道它是否可以处理原始的九个数据集。他将在9月份公布评估阶段的结果。 “我现在只是把它当作彩票,”他说。