試薬ワード スペック自動抽出

Massteryは商品名の自動生成など業界を問わず使用できる機能に加え、特定の業界に特化した機能も提供しています。今回は試薬業界、製薬業界向けの「抗体のスペック自動抽出」機能をご紹介します。

抗体データの特徴

抗体とは特定の標的(抗原)に特異的に結合するタンパク質のことです。その性質を利用して、ライフサイエンス研究のツールとして活用されています。

抗体を構成する要素(スペック)には「抗原種」「免疫動物」「交差性」「タイプ(一次抗体/二次抗体)」「標識」など、主要なものだけで10種類程度存在します。抗体データの特徴として、これらのスペックの情報が商品名にそのまま含まれていることが挙げられます。

特定のスペックを持った抗体を検索したい場合に、商品名に含まれたスペックをそのまま検索するのは精度の観点で問題があります。たとえば「マウス」「ヒト」と言った単語は「免疫動物」「交差性」両方に存在する単語のため、どちらの項目であるかを商品データが保持していないと、検索の際にノイズになってしまいます。

抗体データからのスペック情報抽出

Massteryでは、抗体の名称から各スペック情報を抽出する機能を提供しています。

例えば以下の抗体名は、表1の通りのスペックに分解することができます。

  • マウス抗ヒトIgG2二次抗体、ビオチン
  • Rabbit anti-Mouse CD10 Monoclonal Antibody

表1. Massteryで変換した抗体名

抗原種免疫動物交差性タイプ標識
IgG2マウスヒト二次抗体ビオチン
CD10ウサギマウス

元々はただのテキストだった商品名をこのようにテーブル化することで、管理や検索が圧倒的にしやすくなります。なお、こちらの例では英語データも日本語に変換して保持していますが、英語データとして保持することも可能です。