生物信息学就业前景如何、从业人员又当何去何从?

(本文为个人见解,仅供参考。内容主要针对在企业从事生物信息学分析的工作者,不讨论学校和其他科研单位。)

生物信息分析的工作被很多人视为高大上——不需要做实验也能发文章、作为交叉学科门槛比较高、因为高门槛或者沾了IT的光,所以工资待遇相比生物专业其他方向高出不少。但是入行几年或多或少内心都有一些迷茫:这份工作有没有前途、能否做一辈子?自己又如何提高和改变以适应未来的需求变化?我想在此之前应当先思考一下对这份工作是否有正确的认识。

是否真的高门槛?

作为一个半路出家的生物信息分析工作者在刚接触这行时真的觉得门槛挺高的:要学编程,要掌握Linux操作系统,还有眼花缭乱的测序数据、文件格式和对应的分析软件(还很难安装)。现在回过头来看,这可能只是一厢情愿的想法。我认为从技术水平上可以分成几个不同的阶段(有别于刘小乐教授对“生物信息学研究”的分级):

  1. 以湿实验为主的科研人员和临床医生:使用在线工具、公开数据库、可视化GUI软件做序列比对、进化分析、数据挖掘等工作。
  2. 掌握Linux和基础编程能力:通过编程进行数据整理,在Linux下使用命令行实现更复杂的分析。
  3. 有熟练编程的能力,并掌握大量已有分析软件的使用:可以根据需求快速上手新的分析软件、独立搭建全套分析流程、有idea并能实现一些简单的算法和功能。
  4. 掌握的计算机、数学和编程知识:可以根据需求开发新的算法和软件。

这里从下到上存在这一条鄙视链:做算法的看不上用现成软件的;软件用得熟编程好的鄙视不熟和不好的;编程一般的鄙视连编程都不会的。几个月前才知道在湿实验做生信的人被称作“pet bioinformatician”。虽然这本不是蔑称,但是传着传着就多出了使用者的调侃的意味。

公司里同我一样半路出家的生信分析工作者主要集中在2-3级。初级分析师可能就是2的水平,高级一点的达到3的水平。刚开始工作会感觉到技能有很大提高,只需要不断积累工作经验,从2进阶到3是比较容易的。但达到3之后想要进阶成为4就比较困难了,光靠应付工作的被动学习很难提升。因为重复性的工作只是让人变得更加熟练,收益是边际递减的。打个比方,会使用10种以上基因组组装软件,和会使用5种有什么本质上的不同吗?到了这个阶段就容易开始迷茫,因为感觉自己遇到了瓶颈,而且你的“后辈”们马上就会迎头赶上,他们甚至掌握的编程语言和分析软件,了解的测序技术比你的会的都要新。比如现在都在用三代测序做基因组组装了,会不会用SOAPdenovo又有什么关系呢?

这时候再回头想想就会发现这行门槛其实没那么高。除去做算法和软件开发的,生物信息分析的工作大多就只是在Linux上捣鼓捣鼓别人的软件罢了,核心能力只有软件的使用以及编程。前者不断更新,而且总是越来越好用。而后者在编程启蒙已经普及到小学的今天,那点三脚猫的编程功夫能算什么门槛呢?别说懂技术的内行,投资人和行研也是这样的看法(引自:投资基因测序行业,你应该关注哪些问题?):

产业链的中游就是各类基因测序服务公司。从前文“基因产业链数据分析”图中我们不难发现,中游是市场最大,门槛最低,竞争也最激烈的部分。

高工资到底从何而来?

前面几年工资相对较高,我认为也并不是沾了IT的光。简单来说有两方面原因:公司有钱、急待扩张导致从业人员供不应求。

这个行业,无论做医学还是科研服务,想赚钱都不容易。除了NIPT等目前已经相对比较成熟的产品,医学的市场基本还没打开,群众接受程度还很低;科研服务则本来市场容量就不大,一年20亿左右,还因为公司间竞争激烈把利润越做越低甚至赔本赚吆喝。更不要说几家大公司,已经分去绝大部分市场,剩下公司能赚钱的可能就没几个(二八定律)。市场小、利润率低,那么公司的钱从哪来?

投资

这几年有两句话很流行:

  • 站在风口上,猪都能会飞。
  • 当潮水退去,才知道谁在裸泳。

当经济形势较好的时候,投资热情追捧各种概念。像共享经济、直播、互联网金融。精准医疗也是一个近几年很受关注的风口,大量热钱涌入这个行业。不管以前是做医学的还是科研服务的,都要拿精准医疗蹭点热度吸引投资。投资人可能首先关注的不是公司能否马上盈利,而是规模能否快速扩张,这也就解释了从业人员为何供不应求。2018年开始,特别是下半年,经济增速放缓、投资趋冷,这些曾经风光无限的概念,就一个又一个摔下神坛。

补贴

另外一方面就是依赖各种补贴。各类政府人才计划,落户优惠政策也使得公司人力成本降低。和投资一样,补贴也不可能一直持续。企业如果误将投资和补贴当作可以长期持续的经济来源,甚至当成自己的利润是非常危险的。因为把这台“无法盈利的机器”越做越大,风没了飞得越高就摔得越痛。

从18年下半年开始,精准医疗概念的投资热情明显下滑,很多企业也意识到危机开始裁员(比如华大基因药名明码安诺优达)。本来是社招高峰期的“金三银四”,招聘需求也异常疲软。原来是从业者供不应求的“卖方市场”,现在已是供大于求的“买方市场”。这种行情下,高工资还能持续吗?

行业的发展方向

现在再来想想第一个问题,这份工作有没有前途、能否做一辈子?要知道局部最优解不代表全局最优。因此做职业规划,不能只看当下的状况。这个问题拆解开来,本质上就是两个方面:行业发展的天花板,以及个人发展的天花板

行业的天花板

市场前景

医学基因检测市场前景很广阔无需多言——健康、生存是人类的最基本的生理需求,这也是为什么精准医疗的概念能吸引这么多投资人的目光。而科研服务的市场目前来看已经接近天花板,重点是需求趋向饱和以及资金来源单一(科研经费)。

目前技术能否解决需求

目前无论是医学基因检测还是科研服务,从技术上都已经实现了第一个周期的快速发展。测序通量、相关生物信息学技术都有了很大提高,不过仍旧处于初级阶段,离解决最终需求还有很远的距离。虽然如此,但技术的发展似乎已经遇到了瓶颈,前者依赖基础理论研究的进步以及大规模的数据积累,而后者也很类似——大部分公司在沿袭相似的分析流程,新测序技术、算法、软件的开发很少由这些中游的科研服务公司主导完成。

门槛和竞争

行业的良性竞争和发展需要一定门槛,通俗一点讲就是没有门槛的行业难以持续性赚钱。目前技术上的门槛两者都比较小,导致竞争激烈,主要门槛在于销售(科研服务)、渠道和准入资质(医学基因检测)等方面。作为高科技公司,科技才应当是企业的核心竞争力。对于科研服务类的公司,我认为比较好的发展模式是差异化竞争,找准一两个方向跟进新技术并创新,提高用户体验。医学基因检测公司则应该着重于积累自己的数据库、知识库,打造和迭代独有的决策和解读系统。

个人的天花板

担心自己遇到职场天花板的人可能更多,列举一下周围同事或者我曾经有过的一些焦虑:

  • 科研服务标准化流程分析是比较成熟的产品,没多少技术含量,和流水线工人区别不大。这部分工作完全可以在云平台上实现全自动化,或者用成本更低的人替代。
  • 科研服务的个性化分析偏向劳动力密集型,每个人产出有限,加之不断降低的测序成本和项目单价,以及越来越多可以自己做生物信息学分析的课题组和更加简单易用的软件出现,职业天花板明显。
  • 科研服务公司研发需求不高,除了初创公司,流程一般比较完善。新流程开发通常也是利用现成软件,技术含量低。
  • 医学基因检测行业产品更加标准化,完全不需要人来跑流程。
  • 医学基因检测行业产品的研发也很简单,产品一旦成熟研发人员可能兔死狗烹。

不过我现在倒是有些不一样的想法:

  • 科研服务的流程化分析确实没什么前途,但是个性化分析的需求依然存在。虽然自己能做生物信息学分析的课题组越来越多,软件将来也可能越来越顺手,但是大部分都是基础分析(包括现在出现的大量生物信息分析培训的内容)。并且随技术发展,需求和解决方案也在不断变化之中——需求饱和就创造新的需求。
  • 对于大部分课题组来说,只是将生物信息分析当作一种研究手段,而不打算在这个方向有算法的突破。科研服务公司在选定方向进行差异化竞争时,技术上的积累应当可以领先课题组。科研也追求产出的效率,如果外包效率更高,没有必要非要自己来做(参考一代测序等其他已经产业化的研究/研发外包服务)。
  • 医学基因检测研发的重点不是搭建标准化分析流程(这些本质上和科研服务中的流程没有区别),而是每个公司独有的技术积累——数据库、知识库和决策解读系统。前两个可能不需要生物信息分析,但是构建决策解读系统,对算法有很高的要求,产品也有不断迭代打磨的需求。
  • 生物信息行业目前还处在初级阶段,大量市场没有开拓。当做到和互联网行业相当的规模,相关的需求、产业链、工作岗位都会有几个数量级的提高。行业才刚起步,而不是进入了衰退期,只要个人能力的提升不落后于行业的发展,不用担心太多。

如何自我提高个人能力

上面其实也已经简单提到了行业对人才的需求,那么第二个问题是,自己如何提高和改变以适应未来的需求变化

对于科研服务

如果你的工作一直是跑标准流程,建议尽快参与非标准分析项目。如果打算很长一段时间从事这个方向,你要认识到生物信息学只是解决生物学问题的方法,新算法很少由公司来主导研发,而知道如何解决生物学问题才是你的立身之本。我的建议是:

  • 多看相关方向论文提高科研思维能力,参与课题设计。
  • 多组学综合分析的能力,持续跟进新技术。
  • 尽量发表论文丰富履历。
  • 因为从事的是科研工作,若有必要,提升学历。最理想就是进可攻(企业),退可守(科研单位)。

对于医学基因检测

  • 丰富癌症、遗传病、群体遗传学相关知识。
  • 医学未来的发展方向是大数据、深度学习,算法是核心。需要掌握常见的生物信息学算法,以及深度学习算法。虽然门槛比较高,要向上面提到的第4级进军,但是目前医学数据的积累还需时日,有足够的时间学习掌握。

标签: 高通量测序, 精选, 行业观察

知识共享许可协议 作者: 链接:https://byteofbio.com/archives/10.html
本文采用“署名-非商业性使用-相同方式分享 4.0 国际许可协议”进行许可

已有 10 条评论

  1. Hazel Hazel

    你好,非常感谢您的分享。可以请教一些问题吗?
    我刚生信博士毕业,能力呢,过了刘小乐教授说的level3,但是还没有完全达到level4。进了ivd公司做肿瘤算法开发,感觉有点hold不住。个人觉得高校搞科研模式比较适合自己,但文章发表量又没到进高校,在考虑要不要去医院做科研,能不能给点意见?生信背景在医院做科研怎么样?

    1. 感谢你的评论。按照刘小乐教授的分级,level3已经是非常高水平的研究。能做这个级别的研究说明做不仅能巧妙运用生物信息学的方法,也有扎实的生物学知识和感兴趣的生物学问题,进高校走科研路线是不错的选择。如果文章发表量没有满足理想高校的要求,可以选择在国外找个合适方向的课题组再做博士后研究呀。在医院做科研我也不是很了解,也许优势是拿一手数据难度比较小点。但是周围的人多是临床医生,做生物信息学是不是会比较类似pet bioinformatician,只能孤身奋战?

  2. sbt sbt

    您的文章很棒,很受用,感谢

  3. Dr.Chen Dr.Chen

    在医院做生信比较冷门,周围的都不是这块的,除非你是在全国top前几的肿瘤医院,才有不少可以交流的同事,并且要想拿到一手的测序数据得是领导亲力扶持,让你参与主导项目,否则光科室一堆副高都抢不过来一手资料。但好处就是能拿到医院的平均待遇,不会因为算法能力的欠缺就失去光环,毕竟周围大多人还是连level 1 也达不到的。

    1. 所以要考虑(1)在这样的单位做下去是不是有前途;(2)如果领导发现一直出不了成果,或者成果不如预期,把这个方向砍了,你重新回到市场上,还有没有竞争力的问题

  4. Chou Chou

    你好,我今年生信研究生毕业,请问在公司发展生信硕士博士的天花板是否不一样?现在网上各种劝退生化环材,作为生物学科,您怎么看待生信行业的发展?

  5. ziyan ziyan

    您好,想请教一些问题。本科数学现在有意研究生做生物信息或生物统计,但目前规划不是特别想做科研,想请问一下生信毕业之后转行是否容易。

    1. 我觉得如果本来就要转行,就没必要做生信了。直接去学CS不是更直接吗?

  6. 赵菲 赵菲

    文章写的很不错,很受启发,不知是否方便留下邮箱,保持交流

添加新评论