所以我们需要想清楚到底向算法展示什么数据,才能平衡好数据的代表性和丰富性之间的关系 。
哥本哈根大学的转化性疾病系统生物学家Soren Brunak如是评价 。
除此之外,还可以请行业大佬们制定一个检查表,规范医疗AI领域的研究开发步骤 。
然后,研究人员就能更方便地搞清楚先做什么、再做什么,有条不紊地操作;还能Check一些可能遗漏的问题,比如一项研究是回顾性还是前瞻性的,数据与模型的预期用途是否匹配等等 。
其实,现有已有多种机器学习检查表,其中大部分是基于“EQUATOR Network”先提出的,这是一项旨在提高健康研究可靠性的国际倡议 。
文章图片
此前,上文提到的普林斯顿的Kapoor博士,也和团队共同发表了一份包含21个问题的清单 。
他们建议,对于一个预测结果的模型,研究人员得确认训练集中的数据要早于测试集,这样可以确保两个数据集是独立的,不会有数据重叠和相互影响 。
- 亚马逊|美国科技史上最大规模裁员开启:亚马逊、微软“毕业”均超万人
- 天语|国产手机“春秋争霸”之天语兴衰史
- 钛合金|“非洲之王”传音将推旗下首款折叠手机 :屏幕可滑动拉伸
- 华为|封锁失效!日本拆解华为设备发现问题,外媒:打不死的“小强”
- 超级电容|“华为救星”毛蔚:放弃美国高薪回国创业,只为打破美国芯片封锁
- |7950万片!第二个“华为”崛起,继手机业务后三星再次被中企赶超
- 台积电|技术受限、美芯“威胁”?台积电正式摊牌,赴美建厂迷雾被揭开!
- Mate|曝华为Mate X3将搭载二代卫星通信技术!再次“捅破天”
- 鸿蒙|不是安卓!鸿蒙系统成大学教材 “鸿蒙之父”王成录参与 培养开发者
- 冲击式压路机实体跟梅花碾三角碾冲击压路机“写字楼”“厂家”的差距