mtbinfo.github.io

msinfo manuals

View the Project on GitHub systemsomicslab/mtbinfo.github.io

MRMPROBSチュートリアル

最終更新日:2016/11/16

はじめに

MRMPROBSは、多重反応モニタリング(multiple reaction monitoring; MRM)または選択反応モニタリング(selected reaction monitoring; SRM)だけでなく、SCANおよびデータに依存しないMS/MS取得データ(data independent acquisition; DIA)を使用した、ターゲットメタボロミクス解析の汎用プログラムとして開発されました。 当初、MRMPROBSプログラムは、1回の実行で500〜1000個の小分子を同時にモニタリングする大規模なMRMアッセイのデータセットを処理するために開発されました。このプログラムは、1)データキュレーション用の使いやすいグラフィカルユーザーインターフェイス(GUI)と、2)低分子同定の客観的評価システムを提供してきました。今回、DIA-MSデータ(SWATH-MSなど)およびSCANデータ(GC/MSやLC/MSなど)用に拡張されています。
    データのインポートから統計分析まで、すべてのデータ処理ワークフローがサポートされています。このチュートリアルでは、1)MRMデータ、2)SWATH-MS(DIA)データ、3)ターゲットメタボロミクスのGC/MSデータのワークフローを紹介します。このMRMPROBSプロジェクトでは、ユーザーインターフェイスだけでなく、同定および定量化システムを改善するためのあなたからのフィードバックを歓迎します。

津川裕司
理化学研究所 環境資源科学研究センター
hiroshi.tsugawa@riken.jp


alt
MRMPROBSのスクリーンショット

MRMPROBSチュートリアル

Table of contents

セクション1: ソフトウェアの環境
セクション2: 必要なソフトウェアとファイル
セクション3: プロジェクトのタイプと条件
セクション4: ABFファイルへの変換
セクション4-1: ABFコンバーターのダウンロード
セクション4-2: ファイル変換の条件の確認
セクション4-3: ファイル変換
セクション5: リファレンスファイルのフォーマット
セクション5-1: プロジェクトタイプ1のリファレンスライブラリ: MRMPROBS key index = metabolite name (abf)
セクション5-2: プロジェクトタイプ2のリファレンスライブラリ: MRMPROBS key index = Function (mzML)
セクション5-3: プロジェクトタイプ3のリファレンスライブラリ: MRMPROBS key index = SCAN or DIA-MS (abf)
  セクション5-3-1: DIA-MSデータのためのリファレンスのフォーマット
  セクション5-3-2: DIA-MSデータのためのディクショナリーファイル
  セクション5-3-3: GC/MSとLC/MSデータのためのリファレンスのフォーマット
セクション6: MRMPROBSの実行
セクション6-1: MRMデモ用データセットの概要
セクション6-2: プロジェクトの立ち上げ
セクション6-3: Abfファイルのインポート
セクション6-4: パラメーター
セクション7: MRMPROBSのビューア
セクション7-1: クロマトグラムのビューアでのマウス操作
セクション7-2: Libraryの編集 (オプション)
セクション7-3: ツールボタン
セクション7-4: タブ
セクション7-5: ボタン
セクション7-6: リストボックス
セクション7-7: MRMPROBSで行う解析について
  セクション7-7-1: Fileメニュー
  セクション7-7-2: Data reprocessing
  セクション7-7-3: Statistical analysis
  セクション7-7-4: Missing value methods
  セクション7-7-5: Normalization
  セクション7-7-6: Windowメニュー
  セクション7-7-7: Viewメニュー
  セクション7-7-8: Optionメニュー
  セクション7-7-9: Exportメニュー
付録A: 島津の.lcdファイルの適切なファイル変換方法
付録B: MRMPROBSの3番目のオプション: mzMLファイルの解析


セクション1

ソフトウェアの環境

セクション2

必要なソフトウェアとファイル

MRMPROBSは、Analysis Base Framework(ABF)形式のデータをインポートできます。MRMPROBSは、ターゲット代謝物の名前、保持時間、振幅情報、プリカーサー m/z およびプロダクト m/z を含むリファレンスライブラリを元にクロマトグラムデータを抽出します。ABF変換でサポートされている形式は、島津製作所(.LCD)、Agilent Technologies(.D)、AB Sciex(.WIFF)、Waters(.RAW)、およびThermo Fisher Scientific(.RAW)です。MRMPROBSは、オープンソースのファイルトランスレータであるProteoWizardによって変換された一般的なデータ形式の.mzMLもサポートしています。詳しい情報は 付録B で説明しています。

セクション3

プロジェクトのタイプと条件

alt

1. MRMPROBS key index = metabolite name (abf)

2. MRMPROBS key index = Function (mzML)

* 上記の2つのプロジェクトは、MRMデータセット用です。

3. MRMPROBS key index = SCAN or DIA-MS (abf)

4. MRM-DIFF (abf, mzML)
右サイト参照 http://prime.psc.riken.jp/Metabolomics_Software/MRMPROBS/index.html.

セクション4

ABFファイルへの変換

セクション4-1

ABFコンバーターのダウンロード

  1. 右サイトへ行く http://www.reifycs.com/AbfConverter/index.html.
  2. 要件とライセンス条項を確認し、コンバーターをダウンロードします。

* ファイルコンバーターはフリーソフトです。

alt

セクション4-2

ファイル変換の条件の確認

Bruker、LECO、Shimadzu、Thermo、Watersなどの一部のMSベンダーのファイルを変換するには、特定のデータアクセスライブラリをPCにインストールする必要があります。

ABFコンバーターに関するFAQも参照して下さい。
http://prime.psc.riken.jp/Metabolomics_Software/MS-DIAL/index3.html

ファイル変換の要件

ベンダー フォーマット 要件
Agilent .D なし。ただし、ChemstationのファイルはnetCDFに変換する必要があります。
Bruker .D CompassXtract
LECO .PEG All PEG files should be first converted to netCDF (AIA).
Sciex .WIFF なし
Shimadzu for GC/MS .QGD GCMS solution
Shimadzu for LC/MS .LCD LCMS solutions
Thermo .RAW MSFileReader
Waters .RAW MassLynx Raw Data Reader Interface Library
netCDF .CDF Microsoft Visual J# 2.0

FAQ


セクション4-3

ファイル変換

  1. “AnalysisBaseFileConverter.exe”を実行します
  2. このプログラムに、ベンダーのファイルをドラッグ&ドロップします
  3. “Convert”をクリック
  4. 生データファイルと同じフォルダにABFファイルが生成されます

alt

セクション5

リファレンスファイルのフォーマット

セクション5-1

プロジェクトタイプ1のリファレンスライブラリ: MRMPROBS key index = metabolite name (abf)

タブ区切り形式として5つの項目が必要です。ヘッダー名は任意ですが、項目の順序は保持する必要があります。

alt

1列目.    化合物名a
2列目.    プリカーサー m/z (精密質量は概数で示します)
3列目.    プロダクト m/z
4列目.    保持時間(分)
5列目.    Amplitude ratios [%]b

注意
a MRMPROBSのプロジェクト1を選択する場合、化合物名は機器の設定ウィンドウの化合物名と同一である必要があります。化合物名は、半角英数字記号で記述する必要があります。

bamplitude ratioのフォーマットについて

✓ 例: 1つの代謝物に対し1つのトランジション
  Thymine  125  42.05  5.58  100

✓ 例: 1つの代謝物に対し複数のトランジション
  G6P  258.9  97.05  9.21  100
  G6P  258.9  79.05  9.21  30.1
  G6P  258.9 199.15  9.21  5.5

注意 1: MRMPROBSでは、リファレンスライブラリを編集して、その情報を更新できます。ただし、空欄の項目があると、ライブラリのインポートができません。代謝物の適切な保持時間と振幅情報がわからない場合は、任意の値を入力します。

Note 2: MS機器に入力したすべての代謝物情報を含める必要はありません。

Note 3: Microsoft Excelからエクスポートされたタブ区切りファイルには、予期しない非表示の後続列が含まれることがあります。”Ratio”列の後に予期しない列が入ってしまうと、MRMPROBSで処理できません。複数行を選択することにより、エクスポートされたファイルを検査できます(以下を参照)。 最後の列(”Ratio”)の後に選択されている部分がある場合、Excelでファイルを編集してこれらの列を削除し、再度エクスポートします。

良い例 (非表示の後続列が含まれていない)
alt

悪い例 (非表示の後続列が含まれている)
alt

セクション5-2

プロジェクトタイプ2のリファレンスライブラリ: MRMPROBS key index = Function (mzML)

タブ区切りのテキスト形式として6つの項目が必要です。ヘッダー名は任意ですが、項目の順序は保持する必要があります。(ここでは、ライブラリを簡単に確認できるように、Microsoft Excelで説明しています。)

alt

1列目.    Compound namea
2列目.    Function IDb
3列目.    Precursor m/z (accurate m/z information is rounded into nominal m/z information)
4列目.    Product m/z
5列目.    Retention time [min]
6列目.    Amplitude ratios [%]c

Notes
a MRMPROBSのプロジェクト2を使用する場合、”Compound name”は機器で設定される化合物名と同じである必要はありません。名前は、半角英数字で記述して下さい。

b “function ID”は、このオプションを使用するための最も重要なIDです。mzMLデータには、特定のMRMクロマトグラム(保持時間の範囲、プリカーサーイオン、プロダクトイオン)にアクセスするための明確なキーである”function ID”を示すマークアップがあります。”function ID”とMRM情報の関係を簡単に確認するには、ProteoWizard WebページからダウンロードできるSeeMSプログラムを使って下さい。: http://proteowizard.sourceforge.net/

  1. SeeMSを実行
  2. mzMLファイルを一つ選択する。

alt

データ内で同じ”function ID”を見つけるには、 Microsoft Excelの並べ替え関数と実験条件ファイルを使用します。 ほとんどの場合、proteowizardは、1. Precursor Ion、2. Product Ion、3. 保持時間の開始点の順序でソートしています。

c “amplitude ratio”のフォーマットについては、セクション5-1を参照して下さい。

セクション5-3

プロジェクトタイプ3のリファレンスライブラリ: MRMPROBS key index = SCAN or DIA-MS (abf)

セクション5-3-1

DIA-MSデータのためのリファレンスのフォーマット

MRMPROBSソフトウェアは、GC/MS、LC/MS、LCデータ非依存MS/MS(DIA-MS)などのスキャンタイプのデータを解析できます。次の図は、DIA-MSデータのリファレンスライブラリです。ここでの目的は、DIA-MSデータをMRM(DIA-MRMと呼ばれるもの、たとえばSCIEXマシンのSWATH-MRMなど)として利用することです。このライブラリはMS-DIALソフトウェアを使って簡単にエクスポートできます。: http://prime.psc.riken.jp/Metabolomics_Software/MS-DIAL/

alt

1列目.    Compound name
2列目.    Precursor m/z
3列目.    Product m/z
4列目.    Retention time [min]
5列目.    Amplitude ratios [%]
6列目.    RT begin: クロマトグラムの開始時間
7列目.    RT end: クロマトグラムの終了時間
8列目.    MS1 tolerance: MSデータのサーベイスキャンのための質量精度
9列目    MS2 tolerance: MS/MSスペクトルのための質量精度
10列目.    MS level: MSデータ(MS1)のサーベイスキャンなら”1”、MS/MSなら”2”となる
11列目.    Class: MRMPROBSビューアでクロマトグラムにフィルターをかける時に必要です。必要ない場合は”NA”などと設定して下さい。

下図は、MS-DIALからMRMPROBSへの橋渡しについての説明です
alt

セクション5-3-2

DIA-MSデータのためのディクショナリーファイル

ディクショナリーファイルには、MS1のスキャンレンジと、プリカーサーウィンドウを実験IDとともに含める必要があります。 alt

SWATH(データ非依存)分析の場合、PeakViewで実験ファイルを作成できます(Show-> sample information)。列の順序を変更しないでください。”SCAN”という単語を保持する必要があります。

セクション5-3-3

GC/MSとLC/MSデータのためのリファレンスのフォーマット

MRMPROBSは、GC/MSやLC/MSなどの単一のMSデータを使用できるように改善されています。下の図は、GC/MSデータのリファレンスライブラリを示しています。単一のMSデータセットをインポートするコツは、1)”Product m/z” と”Precursor m/z” に同じ値を、また”MS1 tolerance”と”MS2 tolerance”に同じ値を割り当てること、2)”MS level”として”1”を割り当てることです。
このライブラリはMS-DIALソフトウェアで簡単にエクスポートできます。
http://prime.psc.riken.jp/Metabolomics_Software/MS-DIAL/

alt

セクション6

MRMPROBSの実行

セクション6-1

MRMデモ用データセットの概要

  1. プロジェクトを立ち上げる
  2. Abfファイルをインポート
  3. パラメーターの設定
  4. ソフトウェアの実行 (1-2分/サンプル)

* チュートリアルでは、下記のリンクからダウンロード可能な40のデモファイルとリファレンスライブラリを使用しています。デモンストレーションファイルの共通の測定条件は次のとおりです。

液体クロマトグラム: 各サンプル計25分のラン、CELI L-column2 ODC (150 mm×2.1 mm, 3 μm)を使用。
質量分析: MRM法を用いたネガティブイオンモード
ターゲット代謝物数: 60
トランジションの総計: 166

実験条件の詳細は、下記MRMデータベースからダウンロードできます(Ion-pair LC-QqQ/MS)。

http://prime.psc.riken.jp/Metabolomics_Software/MrmDatabase/index.html

セクション6-2

プロジェクトの立ち上げ

  1. File → New project.

  2. “project type”を選択 (このデモでは一番上のプロジェクトを選択する).

alt

セクション6-3

Abfファイルのインポート

alt

注意:

セクション6-4

パラメーター

alt

このデモでは、”ExampleLibrary.txt”を選択して、上記のようにパラメーターを設定して下さい。

注意:

[推奨するパラメーター設定]
Peak detection
Smoothing method: linear weighted moving average
Smoothing level: 1-2
Minimum peak width: 3-5
Minimum peak height: 50-100

Peak identification
Retention time tolerance: 逆相または親水性相互作用液体クロマトグラフィーを使用した場合、0.1〜0.2分が推奨されます。
Amplitude tolerance: 15
Minimum posterior: ピーク同定の最小確率を決定します。MRMPROBSは、ピークの確率、つまり「計算されたスコアが与えられた真の標的代謝物の確率」を計算します。この基準値未満で検出されたピークは、偽のピークとして認識されます。推奨値は50〜70です。

Note: The first data processing including file import, peak detection, and peak identification requires 5-20 seconds (depending on machine specifications) per file.

セクション7

MRMPROBSのビューア

セクション7-1

クロマトグラムのビューアでのマウス操作

メイン・ウィンドウ

alt

alt

Viewモード

  1. クロマトグラムのウィンドウ: 左クリックしながらドラッグ → クロマトグラムのスクロール、右クリックしながらドラッグ → クロマトグラムのズーム
  2. ウィンドウの上部: 逆三角形を左ダブルクリック → 検出するピークを変えます、任意の場所で右ダブルクリック → 検出したピークを解除します
  3. ウィンドウの下部(保持時間): 右クリックしながらドラッグ → 保持時間の範囲を変えます
  4. ウィンドウの左部(強度): 右クリックしながらドラッグ → 強度の範囲を変えます

Editモード

  1. ピークの端(赤い四角)を左クリックでドラッグ → ピークの端を変えます
  2. 右クリックでドラッグ → 新しいピークを検出します

セクション7-2

Libraryの編集 (オプション)

alt

注意: クロマトグラム・ヴューアの詳細と操作方法については後述します

セクション7-3

ツールボタン

alt

セクション7-4

タブ

alt

Raw data matrix
alt

セクション7-5

ボタン

alt

セクション7-6

リストボックス

alt

代謝物名またはファイル名をダブルクリックすると、クロマトグラム・ビューアにクロマトグラムが生成されます。

セクション7-7

MRMPROBSで行う解析について

セクション7-7-1

Fileメニュー

セクション7-7-2

Data reprocessing

データの再処理は、このオプションで新しく最適化されたパラメーターによって実行できます。再処理は、代謝物ごとまたはファイルごとにも実行できます。ターゲットMRMも変更できます。パラメータは、代謝物ごとおよびファイルごとに設定できます。ファイルのインポートはすでに実行されているため、データの再処理に必要な時間は非常に短いです。

alt

セクション7-7-3

Statistical analysis

現在のプログラムでは、2種類の”missing value approach”を適用できます。また、内部標準、および解析オーダー情報を使用したlowess/cubic splineによって定量化した値を正規化できます。 内部標準を使用する場合は、”Option”メニューで最適な設定をする必要があります。現在のプログラムは、主成分分析も実行できます。

alt

セクション7-7-4

Missing value methods

  1. このプロセスは、列ごと、つまり代謝物ごとに実行されます。
  2. 代謝物の値がすべてのファイルで”N.D.”である場合、ゼロ(0)が割り当てられます。
  3. “N.D.”ファイル以外の保持時間の値が保存され、平均値が計算されます。
  4. “N.D.”ごとに、処理されたEICクロマトグラム(平滑化後)の平均保持時間と”data point”の一貫性の強度が定量値として割り当てられます。

セクション7-7-5

Normalization

“Done”ボタンをクリックした後に、”Statistical analysis setting”が設定できます。
alt

主成分分析を行うことができます。計算される主成分数を設定し、スケールと変換方法を選択します。

alt

マウスホイールでズームイン・アウトができます。各主成分は、X軸あるいはY軸コンボボックスで選択して表示できます。

セクション7-7-6

Windowメニュー

タイルの設定は、コンピューターの解像度に応じて可能です。お好みを選択してください。

alt

セクション7-7-7

Viewメニュー

このメニューで、クロマトグラムヴューアのクロマトグラムをファイルID、分析順序、クラスID、およびファイルタイプでソートできます。

セクション7-7-8

Optionメニュー

このメニューで、代謝物とファイルのプロパティを設定できます。特にこのメニューは、統計解析用のデータマトリックスを作成するために使用されます。
    ファイルプロパティでは、ファイル名、ファイルタイプ、クラスID、および分析順序を再設定できます。”included”のチェックボックスをオフにすると、処理されたデータマトリックスには含まれなくなります。
    代謝物のプロパティでは、内部標準を設定できます。代謝物ごとに個別に設定できます。ただし、内部標準の代謝物名が”internal standard”列の代謝物名と完全に一致している必要があります。そのため、内部標準の設定にはコピーアンドペーストを使用することをお勧めします。このウィンドウでは、キーボードを使用するだけでコピーと貼り付けを実行できますが、マルチコピーも実行できます。たとえば、Ctrl + Cを押して代謝物名をコピーします。”internal standard”列の中でペーストしたい行をすべてマウスのドラッグで選択し、Ctrl+ Vを押してクリップボードの内容をペーストします。

alt

セクション7-7-9

Exportメニュー

生データマトリックス、処理済みデータマトリックス、更新されたライブラリ、検出されたピーク情報の詳細、およびPCA結果は、タブ区切りのテキストファイルとしてエクスポートできます。さらに、PCAの結果は、一部の画像形式でエクスポートできます。

alt

付録A

島津の.lcdファイルの適切なファイル変換方法

LC-QqQ/MS(MRM)分析の後に.lcdファイルの内容を変更できますが、MRMPROBSソフトウェアのファイル変換を成功させるには、適切なメソッドファイル(.lcm形式ファイル)を作成することが非常に役立ちます。

1. イベント名とチャンネル(MRMトランジション)ルール

alt

2. 化合物テーブルのアップデート
MRMトランジションのメソッド構築後、MRMイベントによって化合物テーブルの m/z を更新する必要があります。更新されたメソッドファイルを使用してサンプルを分析できる場合、安定したファイル変換のために他のタスクを実行する必要はありません。

alt

更新されたテーブルは、”Method”->”Data Processing Parameters”->”Compound”で確認できます。

alt

3. データ(.lcd)が上記の適切な方法で収集されなかった場合、上記の方法で変更されたメソッドファイルを使用して.lcdファイルを改善できます。更新されたメソッドファイルの構築後、LabSolutionsの”Postrun Analysis”を開いてください。

alt

解析ファイル(.lcd)を選択した後、”Apply to Method”ボタンを押して下さい。

alt

変更したメソッドファイルを選択し、複合テーブル m/z を含む.lcdファイルを改善します。これを行えたら、ファイル(.lcd)はReifycs Inc.ソフトウェアによって正常に変換されます。

alt

4. ファイル変換
条件: LabSolutionsソフトウェアをインストールすることにより、.lcdファイルから.abfファイルに変換できます。ファイル変換には、LabSolutions ver. 5.53 SP4以降の”TTFLDataExportVer5.dll”が必要です。”TTFLDataExportVer5.dll”(Program Files (or *86)>LabSolutions)のプロパティを確認して下さい。ファイルサイズが577,536バイト未満の場合は、島津製作所に連絡してファイルの変更を依頼してください。
“AnalysisBaseFileConverter.exe”を開いた後、.lcdファイルをこのコンバーターにドラッグ&ドロップして下さい。

alt

“Convert”ボタンを押して下さい。ABFフォーマットのファイルが、.lcdファイルのある同じフォルダに生成されます。

付録B

MRMPROBSの3番目のオプション: mzMLファイルの解析

必要なソフトウェアとファイル

MRMPROBSは、mzML形式のファイルをインポートできます。MRMPROBSの3番目のオプションでは、”function id”を使用してクロマトグラムデータを抽出します。 ユーザーは、通常のライブラリ形式に加えて、リファレンスライブラリに”function id”情報を追加する必要があります。

ProteoWizardのダウンロード

  1. ダウンロードタイプの選択: Windowsインストーラー(ベンダーリーダーサポートを含む)をお勧めします
  2. 利用許諾契約を読んで、proteowizardをダウンロードします

alt

(http://proteowizard.sourceforge.net/downloads.shtml)

ProteoWizardのセットアップ

  1. ウィザードウィンドウに従います
  2. “SeeMS”もインポートします

ProteoWizardでのベンダーのMSファイルからmzMLへの変換

  1. MSConvertGUI.exeを実行
  2. “List of Files”を選択
  3. “Browse”ボタンよりベンダーのファイルを選択
  4. “Options”で、”Use numpress linear compression”、”Use numpress short logged float compression”、”Use numpress short positive integer compression”はチェックしないでください。“binary encoding precision”はどちらも利用可能です。
  5. “Start”ボタンをクリックして下さい

alt

注意! ProteoWizardは島津のMSフォーマットはサポートしていません。島津のMSフォーマットを使用したい場合は、abfコンバーターを使って下さい。