读研究生秘技二一:将应用研究成果写在祖国大地上
读研究生秘技二一:将研究成果写在祖国大地上。2020年1月29日,国家科技部就应急项目的管理发文通知,其中强调了,“要把论文'写在祖国大地上',把研究成果应用到战胜疫情中”。显然,不仅是战疫需要“写”,其它研究方向也值得这么写。
那么,要如何”写“呢?存在哪些困难和可行的解决方案呢?
这里,分析下科研院校“写”的不足、优势以及与企业合作的好处。
一、不足
首先,要做应用,与市场上相似行业或有相似产品的公司相比,竞争力是否具备呢?以人工智能领域来例,目前多数性能好的创新和应用,都是基于深度学习,且非常依赖于硬件GPU和大数据。显然,学校在这些方面不占优势。
与一些大的公司相比,学校购买硬件GPU的规模不在一个量级上,对硬件的购买多是以小团队申请国家或省级项目来获得的。尽管近年来,各类项目的支持力度已越来越大。但即使如此,硬件的预算往往特别容易被优先砍掉。因为管理部门可能会认为,既然已经有GPU服务器了,为什么还要购置呢?实际上,在目前的人工智能研究和应用上,数据的优化严重依赖于在GPU上批处理的能力。一两台服务器通常只能同时处理少量的批数据。而GPU越多,处理能力则越强,也更有利学生们有充分的算力测试提出方法的性能。比如我的研究小组,15个学生,约30块GPU,平均每人能有2块GPU用来做数据分析和测试模型性能。平日还能满足需求,1个学生占10块卡做研究也没问题。但一到会议投稿前夕,如果大家都在准备论文的话,对GPU的需求,就有点捉襟见肘了,只能大家协商用机器的时间了。我想说的是,我的研究小组的硬件环境、GPU数量应该算中等偏上的,更多的老师是缺足够的硬件支持的。
其次,是大数据的缺乏。以新冠为例,学院层面很难拿到大规模的新冠肺炎的CT图像数据集,这里面既有企业或医疗部门从隐私角度考虑的原因,也有数据本就难以第一手为学校获得。类似的问题,在其他领域也是一样。这也就是决定了学校层面在遇到大数据和硬件两个瓶颈时,无法去与大的公司竞争。以前,这种情况只是限于应用层,而深度学习流行后,甚至在研究层面,学校也容易处于劣势。比如,在曾经非常难发表论文的国际顶级会议上,现在某些大公司一次发20到50篇都已经不足为奇了。其原因就是硬件、大数据都集中在公司那边。在此环境下,学校能做的,似乎主要是一些理论上困难的点,或短期内无实际落地应用的一些研究。
相对于硬件与数据来说,另一个更要紧的是人才。对于公司而言,人才团队更加稳定,且都是熟炼工。越好的公司,人才越是通过更顶端的剪枝来获得。而对于学校而言,研究生就像流水的兵,新来的兵还不能直接打仗,得好好培养一段,到差不多成熟了,又到了该飞的时候了。
其次,学校给到研究生的补助也无法与企业来竞争。即使部分老师能给出相当的,那也是凤毛麟角,无法扭转科研院校整体薪酬少于企业工资的局面。所以,很多情况下,大多数老师很难阻止学生偷偷跑去实习。尤其是,学生为了工作岗位去找的那种实习就更难阻止。因为很多企业要求如果学生要获得工作岗位,需要来单位实习三个月以上,方有资格入选。但从我的经验来看,学生一旦进入实习环节,后面的研究能力就直线下降了,鲜有例外。这可以说是,企业通过薪酬和就业岗位稀缺等因素,减少了科研院校对学生科研能力的培养时间。
二、优势
尽管存在不足,学校也有其独特的优势。比如基础研究,就得以科研院校为主来做。举个例子,现在人工智能领域中对非线性的、弯曲空间结构(称为流形)里的数据分析和相关应用是比较热门的,代表性的工作可以追溯到2000年左右。但这一概念却是黎曼1857年的初次演讲中,在“论作为几何基础的假设”中提出,相差近140年。虽然这个时间差有点大,但一般来说,应用性研究较基础性研究是具有一定的滞后性。
因此,多数公司是不会考虑这类时滞性太长或前瞻性太远的研究方向。因为一个公司是需要考核关键绩效指标,即KPI的。如果一个方向3-5年见不到成效,如果不考虑广告效应,也许早就放弃了。相反,学校较少关注这种短期绩效,而对探索性研究有着更大的宽容。因此,在需要较长时间的研究方向上,科研院校的科研模式会有更高的概率形成好的成果和突破,并对若干年后的潜在应用提供持续的理论支持和算法保证。
其次,尽管学生流动性强有其不足,它的好处是能防止思想僵化、保持团队持续有强的创新能力。其原因是因为学生来自全国各地,受到过的教育千差万别,思维模式迥异。另外,学生普遍年轻,这通常是创新的高发年龄区。因此,他们更容易产生很多意想不到的想法。其三,是动手能力虽然可能不如公司的熟练人员,但其可塑性很强,对问题的领悟能力和适应能力都不会太慢。第四,学校有更从容和长的学习时间,如果学生能坐得住,沉下心,往往可以思考一些难的科学问题。这也让学校在基础研究和应用性研究两方面都有其独特的优势。反过来看,企业更偏好稳定,一旦某个产品达到成熟,往往会把重心放在维护和小修小改上。
第三,多数学校在学科上的配置几乎是完整的,互补性很强。如果善于沟通和有效利用各方面的资源,往往更容易形成重要的交叉研究成果。比如2019年登上《自然》十大热点文章之首,关于亨廷顿舞蹈症治疗方案的工作就是复旦大学生科院与光学系合作完成的。
三、与企业和应用型单位沟通合作
除了学校的独立研究外,要写到祖国大地上,更直接的办法是与企业和应用型单位合作。
联合开发应用,好处颇多。首先,与企业的合作比较容易找到实际应用问题。如果只研究学术界关心的科学问题,往往容易脱离实际,也不容易把自己的科研成果转化到实际应用中。我的研究小组这几年在把应用“写”在祖国大地上,做了一些初步的尝试,包括气象预测和自来水的混浊度处理等。一个直接的感受是,很多问题是以前纯做学术研究发现不了的。而企业或其他应用型单位,对实际问题有丰富的实战经验,理解也比学校深刻,能提供更贴近实际问题的指导或建议。相互合作,确实可以促进学术成果的有效转化。
其次,通过与企业进行良好的沟通,学校的研究团队也能更有效的处理从企业或其他应用型单位获得的数据。比如我们之前和上海某自来水厂的合作。拿到的水厂数据,检查后发现,有好几处数据出现过大量的缺失值或0值。如果直接丢进程序里跑,肯定是报错。一开始不得其解,后向水厂相关人士询问,才知道,原来是水厂需要对控制阀门进行定期检修,检修期间没有输出,但缺失值仍会被记录到数据中。另外,有些传感器为了保证自己的工作是正常的,会有意在工作中给一个最大值,以实现自检。这些,都需要跟其他单位的专业人员进行沟通才能清楚。类似的情况挺多,如果缺乏沟通,只跑论文中常见的公用数据、仿真数据,是根本不可能解决实际问题的。
第三,与企业的合作能够较好地实现“写”的平衡。很多应用是一个系统工程,不是说形成了理论性的创新就能“写”了,也不是说“写”好就没事了。系统工程,往往意味着需要与多个已知的技术和方法进行互补,才能完成。而做已知技术的融合,可能并不是学校关心的重点。另外,如前所述,应用性成果往往涉及后期的维护,需要有稳定的人员。通过与企业的合作,能够将后期的维护以及系统工程的搭建更多地交到企业一方。
当然,要真正把应用做好,写到祖国大地上,实际问题不是三言两语能讲完的。但我相信,如果学校的研究团队能根据自己的研究现状,适当选择与自己研究方向相吻合的应用,不怕麻烦,而企业也多些耐心,多把问题向学校研究团队进行明晰的呈现,彼此做好充分的沟通,就会获得好的应用落地,学生也能在这一过程中得到好的实际锤炼。
张军平
2020年4月9日
留言与评论(共有 0 条评论) |