Guide to Scientific Writing Put Your Best Figure Forward: Line

Guide to Scientific Writing
Put Your Best Figure Forward: Line Graphs and Scattergrams
Thomas M. Annesley*
University of Michigan Health System, Ann Arbor, MI.
* Address correspondence to the author at: University of Michigan Health System, Room UH2G332, 1500 East
Medical Center Drive, Ann Arbor, MI 48109-5054. E-mail annesley@umich.edu.
科学論文作成の手引き
最も適した図表を提示しよう:線グラフと散布図
古くは、「百聞は一見にしかず」ということわざがある。事実、十分に準備され、一目瞭然な図のみ百聞の価
値を持つ。これは研究においても同様で、我々のメッセージを伝える際に用いる主な方法の一つが、図とグラ
フである。図とグラフは、読み手が情報を見て、理解し、覚えることの補助として、視覚的に最重要ポイント
示すことで説明をしているのである。最近、読んで価値がある思った論文を考えてみてほしい。結果を説明し
た文章や、更には実際の数字を覚えていることは少ないだろう。しかし傾向や、関係性、結果、カテゴリー、
またはグラフ中に示された一般的な実験パラメーターなどを思い出すことは出来るだろう。本文の記憶はすで
にほとんど無いという事実にも関わらず、発表された論文中のグラフを妥当に再現することが出来、そこから
何を覚えているのか述べることが出来るであろう。
この教育用論文では、線グラフと散布図について考察し、読者があなたとあなたのメッセージを思い出すには、
どのように最も適した図表を提示したらいいのか例を使いながら説明していく。
良いグラフの基本
グラフの構成要素は、軸、ラベル、目盛り、原点、一目盛り、又は基準点、記号、そして凡例である。しかし、
これらの基本以外にも「良い」グラフには、いくつかの特性がある。
1.
グラフそのものではなく、データに注意を導く
1
2.
データの点(記号)や線が読み取りやすく、区別しやすい
3.
軸の数字とラベルの両方が読み取れて、意味が明確である
4.
2 つの軸の長さが、視覚的にバランスが取れている(X軸とY軸の比率=1.0 から 1.3)
5.
それぞれの軸に使われる目盛りが、データの範囲と一致する
6
一目盛りが的確である
7.
凡例が明確で簡潔である
8.
読者が本文を前後に参照せずにメッセージを理解することができる
9.
そのデータはグラフに適している
線グラフと散布図は、縦軸と横軸、一般的にそれぞれ X 軸と Y 軸と呼ばれる軸を持ち、2 つ以上の変数の関係
性を表すものである。慣例により、X 軸に表示される変数は「独立変数」と呼ばれる。独立変数は調査者によ
って操作されたり、変化する変数のことである。Y 軸に表示される変数は「従属変数」と呼ばれる。この変数
は独立変数の値に依存して変化することから、従属変数と呼ばれる。それは独立変数が変わると同時に変化す
る。
例えば、処方薬投与量と血清フェニトイン濃度についての研究がある。投与量が独立変数で、血清濃度結果が
従属変数であり、これは血清濃度が独立変数によって変化するからである。これを以下の質問のように考えて
ほしい。投与量を変えること(原因)は、フェニトイン濃度の変化(影響)をもたらすのか?この方法で原因
と影響の関係を突き止めることは、この研究が独立変数と従属変数を持っているのか、また実験結果を示す為
に図表をどのようにデザインすべきなのかを決定する上で助けとなる。
その他の例は非侵襲性腫瘍病期診断としての血清前立腺特異抗原(PSA)についての研究である。この場合、
周知(独立)変数は腫瘍ステージ(あらかじめ定義された変数、又は参照ポイント)で、不知(従属)の変数
は患者血清中 PSA 濃度である。グラフ上に 1 つ以上の従属変数を表すことは可能である(例えば、トータル、
遊離 PSA)が、この研究においては腫瘍ステージである独立変数は、一つのみグラフ上に表すことが出来る。
多くの研究は独立変数を持つが、それは完全な必要条件ではない。ある研究では、2 つの変数の関係性を、因
果関係の証拠の無いまま調査している。トロポニン定量における 2 つの分析方法の比較が良い例である。この
場合、どちらの方法もお互いへの影響はなく、よって独立変数が存在しないのである。どちらの方法のデータ
も Y 軸に示すことが出来る。しかしながら研究において、分析結果またグラフに表しているデータが、独立変
数を持つのかを明らかにするのは重要である。
図 1 は先に述べたような、的確な特性を備えた線グラフの例である。このグラフは新しい抗ウイルス薬である
Albenovir の効果を見るプロセスの研究からのデータを示している。この研究では、Albenovir は無作為化され
たグループの患者に、5 種類の違う投与量で毎日経口投与された(0, 2, 5, 10, 20 mg/Kg)。患者の血液サンプル
2
は治療初期の選択された時期に採取され、循環ウイルス粒子を分析した。ウイルス量対時間の変化は、グラフ
に示された。この図では、違う投与量を表している記号は大きく、それぞれを区別しやすいので、理解しやす
いのである。記号をつなぐ線もまた明確で、データに注意を引くのに十分な太さである。2 つの軸の内側にあ
る記号と線、またはカーブが最も重要な要素であり、軸のラベルの文字などはそれほど目立つ必要はなく、軸
と一目盛りの重要度は低いというのが一般的な法則である。このグラフでは、2 つの軸の線の長さがつりあっ
ており、データから注意をそらさないよう十分に細い。重要な情報を強調する軸のラベルの文字サイズは、軸
上の数字や一目盛りよりも大きい。一目盛りのマークは軸の数字に関係していて、軸の中のデータに関係して
いないことから、軸の外に位置する。目盛りはまた値の範囲に比例し、グラフ全体で無駄なスペースが最小限
である。
図 1. Albenovir の経口投与による血中ウイルス量の経時的変化;■, 0 mg/Kg; △, 2 mg/Kg; ▼, 5 mg/Kg, ◆, 10
mg/Kg; ◆, 20 mg/Kg
この図の凡例は簡潔で、本文に戻らずともメッセージを理解できる。図 1 のグラフは凡例が重要な情報を提供
しているためにタイトルを含まない(しばしばパワーポイントのスライドでは含まれる)。
図 2 は、図 1 で示されたデータのレイアウトを改善したいくつかのオプションを表している。図 1 は簡潔で、
無駄なものが無いが、読者は違う治療プロトコールを示す記号と線に関連した凡例を、前後して参照しなけれ
ばならない。もしグラフ中、又はグラフの右側に余分なスペースがあれば、図 2A で示すように記号のリスト
を加えることも考慮できる。しかしながら、もし記号リストを加えた場合、リスト中の記号の順番(上から下、
又は左から右)がここで表すように実際のグラフ中に示している記号と線の順番と同じであることが重要であ
る。この方法の利点は、凡例中のメッセージを簡略化できることである。もしスペースがあるならば、もっと
効果的なデザインと、それぞれの個別のラベルを線やデータの隣に配置することも考慮できる(図 2B)。
3
図 2. Albenovir の経口投与中の血液中ウイルス量の経時的変化。 (A-C)同じデータの違う表し方。
時々、この Albenovir データのように、データの点が X 軸や Y 軸の上に直接かぶってしまう(または非常に近
い)場合がある。このような場合、特にグラフが印刷サイズに合わせて縮小された時には、データの点が軸の
線によって視覚的に歪んだり、隠れてしまうことがある。このような状況で(そしてこの状況でのみ)、片方
の、又は両方の軸をデータの明瞭な視覚化のために埋め合わせることが出来る(図 2C)。練習として、図 1
と図 2 のデータ表示と凡例を比較し、それぞれがどのように見て、読み取ることに影響しているのか評価して
みなさい。
4
一般的な誤り
次の 3 つの例は、著者がグラフを準備しているときに陥る一般的な誤りを示している。図 3 は 150 人の患者か
らの血漿と血清ナトリウムの対サンプル間の関連性を示している。重病の患者であってもナトリウム濃度は
125 – 165 mmol/L と非常に狭い範囲に収まる。多くのコンピュータープログラムは自動的に X 軸と Y 軸の交差
部分を 0 と設定するので、グラフは図 3A で示すように見えるかもしれない。このようなデータ表示には 3 つ
の問題がある。第一に、データの点がお互いに近く固まっており、分散や異常に高い又は低い値を見つけるの
が非常に困難である。第二に、相関関係線があったとしても、1 つか 2 つの外れ値が全体の相関データに過大
な影響を及ぼすのかどうか判断するのが難しいかもしれない。第三に、そのような点はデータ上の情報を的確
に伝えることが出来ないため、スペースの無駄であり、編集者は経済的、そして美的にも好まないのである。
この同じデータは、軸の目盛りを本来のデータの範囲に合うように狭めることでより、明確に示すことが出来
るのである(図 3B)。更には Bland-Altman plot を用いることで、より良いデータを示すことが出来る(図
3C)。ここでは設定上の 95%限界の外との違いを簡単に見ることが出来る。
5
図 3. 150 人の患者からの対検体での血漿対血清ナトリウム濃度。(A) X 軸と Y 軸目盛りが 0 – 165 mmol/L ;
(B)X 軸と Y 軸の目盛りが 120 – 170 mmol/L; (C)Bland-Altman plot。
同様に、編集者は図 4 に示されるようなグラフの結果をしばしば見かける。この仮説例では、ストレスの高い
実験のラットについての研究をサポートするため、血漿アラニン濃度測定用の新しい高速液体クロマトグラフ
ィーを研究者が開発したとする。大学間の血中アラニン濃度測定の分布の検証するために、検体は 4 種類の違
う抗凝固剤の入った試験管に採取され、遠心分離と血漿の凍結前に、選択された時間、室温で保管された。図
は未使用のスペースを無駄にしたり、データを圧縮しているが、ヘパリン検体での明らかな時間依存アラニン
濃度の損失が図 4A で見られる。図 4B のように Y 軸を伸ばすことは、スペースをより良く使用するだけでは
なく、18 時間の間に、シュウ酸入り試験管での約 10%の血漿アラニン濃度の時間依存的上昇をも示している。
6
図 4. 室温での全血保存後の血漿アラニン濃度のパーセント変化。(A)Y 軸目盛りが 0 – 110 µg/L; (B)Y 軸
目盛りが 70 – 110 µg/L。
図 4B での方法は時々Suppressed Zero と呼ばれる。データ表示の明瞭さが増すとしたら必ずしも悪いことでは
ないが、もしわずかな違いであることを誇張するのに使用された場合、suppressed-zero 目盛りがどれ程間違っ
た解釈を導くのか見て取れるであろう。報道関係者はしばしば、Y 軸範囲が制限された経済データのグラフを
作成することで批判を受け、どんな変化をも人工的に誇張するのである。よって、もしあなたが拡張した目盛
りを使用する場合、図の説明に、目盛りが拡張されていること、又は 0 から始まらないことを直接述べること
で、読者に注意をよびかけるべきである。
図 5 は良いグラフとされる基準のすべてを、1 つを除き満たしているものである。それは何だか見当がつくだ
ろうか?それは、グラフとして提示される必要のない結果の良い例である。これは有用な結果であり、報告さ
れるべきである。しかしながらメッセージは本文の中で、「全血検体はシュウ酸、EDTA、クエン酸、又はヘ
パリン入り試験管に採取され、室温で 72 時間まで保存されたとき、どの試験管においてもタクロリムス濃度
での統計的有意性は見られなかった」と容易に伝えられる。
7
図 5. 室温保存後の全血タクロリムス濃度のパーセント変化
練習問題
良いグラフと悪いグラフの特徴について、ここで紹介された情報を元にグラフの視覚的影響から、加える、又
は削除する特徴を特定できなければならない。図 6 で示される例は、少なくとも 12 の問題がある。これらを
特定できるだろうか?答えは追加読み物リストの後の囲みの中に示した。
図 6. 治療中のウイルス量の変化;●, 0 mg/Kg; ◆, 5 mg/Kg; ■, 20 mg/Kg
8
最終的考察
人は生来、視覚で表現をする生き物であり、著者(私も含め)は何を成し遂げたのか「表現」したいのである。
百聞は一見にしかず、しかしいくつかの適切な言葉もまた、図に取って代わりうるのである。重要なことは、
メッセージを最も効果的に述べる為に、いつ何を使うのか知っていることである。
追加参考文献・書籍
Day RA, Gastel B. How to write and publish a scientific paper. Westport (CT): Greenwood Press; 2006.
Freeman JV, Walters SJ, Campbell MJ. How to display data. Malden (MA): Blackwell Publishing; 2008.
Gustavii B. How to write and illustrate a scientific paper. New York: Cambridge University Press; 2008.
Lang TA. How to write, publish, and present in the health sciences. Philadelphia (PA): ACP Press; 2010.
Zeiger M. Essentials of writing biomedical research papers. New York: McGraw Hill; 2000.
練習問題の答え(図 6 の問題)
記号が小さすぎる
記号が似すぎている(黒塗りの四角、丸、ひし形)、そして区別しづらい
データの点をつなぐ線が細く、データに注意がいかない
ラベルの文字が小さい
X と Y 軸が太すぎ、データから注意をそらしている
軸上の数字が、比例的に大きすぎる
軸上の数字が 2 種類の違う字体を使っている
Y 軸の数字は、不必要な小数点を含んでいる
Y 軸の目盛りが大きすぎ、無駄なスペースを作っている
X 軸には「月」と書かれており、詳しい説明があれば読者が本文に戻る必要性を減らせる。
一目盛りのマーカーが軸の内側にあり、記号を隠している
X 軸と Y 軸の比率が大きすぎる(理想は 1.0 から 1.3)
9
グラフ中の記号凡例は違う治療法を示すが、図凡例は mg/Kg の投与量を示している
グラフの凡例中の記号の順番(上から下)が図中の実際の順番(上から下)と違う
(訳者:加藤
久美子)
謝辞
Author Contributions: All authors confirmed they have contributed to the intellectual content of this paper and have
met the following 3 requirements: (a) significant contributions to the conception and design, acquisition of data, or
analysis and interpretation of data; (b) drafting or revising the article for intellectual content; and (c) final approval of
the published article.
Authors' Disclosures of Potential Conflicts of Interest: Upon manuscript submission, all authors completed the
Disclosures of Potential Conflict of Interest form. Potential conflicts of interest:
Employment or Leadership: T.M. Annesley, AACC.
Consultant or Advisory Role: None declared.
Stock Ownership: None declared.
Honoraria: None declared.
Research Funding: None declared.
Expert Testimony: None declared.
Role of Sponsor: The funding organizations played no role in the design of study, choice of enrolled patients, review and
interpretation of data, or preparation or approval of manuscript.
Received for publication April 30, 2010. Accepted for publication May 6, 2010.
10