image frame

从AUC到DCA

DCA全名 Decision Curve Analysis,即决策曲线分析法,在 2006 年由 MSKCC 的 Vickers 和 Elkin 首次提出 1, 2, 3,用于评估临床中的诊断模型、预后模型等。相较于在二战时期被发明的ROC曲线,DCA还非常年轻,但已在临床模型评估中展现出其独有的优势。因为此分析法并不重点关注于灵敏度及特异性,而是从患者的净收益情况、及其自身意愿的角度来评估模型的优劣。

在本文中,我将从二元分类问题入手,系统介绍ROC曲线以及DCA曲线

阅读更多...

癌症突变解读协会 -- VICC

今天要介绍的是Variant Interpretation for Cancer Consortium (VICC) 癌症突变解读协会,这一协会隶属 Global Alliance for Genomic and Health 组织之下,旨在促进肿瘤界中的突变的解读。虽然 AMP/ASCO/CAP 在2017年就发布了这方面的指南,但细读之,就能发现里面留下了很多待解决的问题。而 VICC 项目的发起,就是为了解决这些问题,因此 VICC 的原文非常值得一读,文献地址请见文末

阅读更多...

爬虫工具推荐 -- ParseHub

爬虫这玩意虽说入门简单,但写起来着实麻烦,更可恶的是在生信中用到的机会不多,基本脚本都是一次性的,用完一次后就再也用不上,每次再要用的时候又得回去查各个包的语法,特别不方便。终于,就在今天,我找到了一款可以一劳永逸的爬虫软件, 无需自己编写任何代码,就能完成你能想到的全部爬虫功能,这就是 – ParseHub

具体怎么操作,ParseHub 自己有很完整的教程,安装好后跟着一步一步走就行,这里就不在冗述,只是简单介绍一下它的功能:

  • 通过点击来选择想要下载的内容(文字、图片均可)
  • 自动猜测需要下载的内容
  • 关联下载的信息
  • 支持“下一页”的跳转(可重复爬取同类型的页面)
  • 支持不同格式的页面跳转

虽然这款软件功能很多,但基本只要掌握以上几项功能,通过特异性组合,就能爬取到你想要的绝大数信息

官方链接:

https://www.parsehub.com/

Phasing

这一篇拖了挺久,一来是五一的时候出去玩了一趟,就偷了会懒,结果五一回来一直忙于工作,就又拖了一周,等我缓过神来才惊觉已经过去了半个多月,因此赶忙过来补上一篇。

上文说到,phasing 的根本目的,是将测序所得的碱基序列,重新正确的划分至他们本身的起源。而这一方法,在绝大数语境之中,指的便是将序列归为父亲或者母亲的染色体之中。目前大多数 phasing 的方法都是基于这一目的展开的,在肿瘤之中并不适用,由于肿瘤异质性的存在,测得的碱基序列可被归到不同的亚克隆之中,这使得传统 phasing 方法无法被使用。

阅读更多...

Multi-nucleotide variants

之前写过一篇关于MNV的文章,但感觉写的逻辑混乱,故推翻重写一篇

MNV (multi-nucleotide variants) 即多个碱基发生变化的突变,是有两个甚至多个 SNVs / InDels 合并而成,至于为何不将这些 SNVs / InDels 分别对待,则由于它在临床上、生物学上具有特殊的意义,因此特意归为一类突变。

至今为止,关于MNV并没有一个准确的定义,虽然大家都明确同一单倍型上的突变需要被合并,但无人指出具体多近的突变应该被合并。

阅读更多...

肿瘤的分级、分期、分型

这篇文章一开始只打算写个TNM分期的介绍,但后来学习到临床上的各种划分方式,索性就仔细研究了一下,一起记下来。

肿瘤之中有分级、分期与分型之说,而分级 (grading) 和分期 (staging) 这两个概念常常被放在一起讨论,初次遇见往往会被混淆。首先它们均是对恶性肿瘤 (malignant tumour) 的描述方式,分级 grading 是一种描述肿瘤恶性程度的指标,也就是肿瘤的分化程度;而分期 staging 则是描述恶性肿瘤的生长范围和扩散程度,在很大的程度上可以用于指导治疗方式和预后的评估。

阅读更多...

肿瘤突变分类 -- VIC

虽然肿瘤突变指南早在2017年1月就由AMP,ASCO和CAP联名发布,但过去的三年里,实际上采用次标准的公司并不多,只有最近几个月才采取此标准的呼声才逐渐强烈。

抛开大家的采用的意愿不谈,个人认为此标准难以统一的原因是,指南中存在很多模糊、甚至相冲突的概念,很容易造成大家的困惑。例如指南中提出的10个判断标准,并没有说明具体的划分界限,以及各个标准所占的比重为多少。这样在实际操作过程中,就很容易会产生分歧。

而前两日我忽然发现王凯团队开发的一款名为 VIC (Variant Interpretation for Cancer) 的肿瘤突变分类软件,在指南的基础上融合了 Global Alliance for Genomics and Health (GA4GH) 组织中提及的肿瘤评判资料 ,对上述提到的模糊区域进行明确的定义及填充,能很大程度上实现突变分类自动化这一过程。

阅读更多...

ssh快连+免密

由于工作需要,我往往会在多台服务器上反复切换,将文件从一个服务器传到另一个服务器上,因此会非常频繁的用到 scp ssh 这些命令,下面这两个功能能很大程度的省去其中的一些麻烦

简化SSH

首先在家目录下建一个~/.ssh 目录,然后编辑一个名为 config 的文件。

在这个文件中输入想要简化的服务器,例:

1
2
3
4
Host server1
Hostname 123.456.78.910
User kai
ForwardX11 yes

并将此文件的权限给改成:

1
chmod 700 config

就大功告成了

之后想要链接那台服务器,只需要:

1
ssh server1

就okay了

SSH 免密

免密的过程也十分简单,两步就能完成:

  1. 先生成一对 public/private key

    1
    ssh-keygen -t rsa
  2. 把其中的public key 给放到另外那台服务器上

    1
    ssh-copy-id -i ~/.ssh/id_rsa.pub remote_host
  • © 2020-2021 Kai
  • Powered by Hexo Theme Ayer
  • PV: UV:

请我喝杯咖啡吧~

支付宝
微信