How do you split into or combine with your data to make research paper?
はじめに
仮説検証型の研究をおこなう場合、取得したデータのほとんどを使って仮説を検証し、論文を執筆する。だがしかし、実際のフィールド研究ではとりあえず目的を設定して、データを取ってから、ストーリーを考えて論文を書くことが多い。表向きは仮説検証のように見せかけている論文も実際は後付け仮説検証になっていることが多いだろう。
そのような場合考えなくてはいけないのは、手元のデータをどれくらい、どのように使って論文を書くかである。手元に5個の関連しあった図がある場合、
- すべて使って1本の論文を書く
- 2個・3個使って2本書く。
- 1個づつ使って5本書く。
など様々な選択肢がある。この組み合わせと数を決める作業は実はとても大事である。冗長にデータを使ってしまう、たとえば図を増やしても論文のメッセージが変わらない場合、折角3本分の論文になるデータ達が1本にしかならないことがあったり、データ総動員すれば素晴らしい論文になるのに、小分けにした結果、引用されないような小さな論文が沢山生まれるだけで、ハイインパクトな論文を世に残すチャンスを逸してしまうこともあるだろう。
てことで今回は、仮説を持たずに蓄積してしまったデータをどのように切り分け・組み合わせて論文を作っていくべきかについて、筆者の体験を踏まえて考えていきたい。
実体験
修士1年から博士1年の3年間、「セミ幼虫を食べるヒグマ」という面白そうな自然現象に注目し、地道なフィールドワークによってデータを集めてきた。博士1年の途中から論文を書き始めたのだが、修士のころは自分の取ったデータで論文を書くということを考えてなかったため、頭の中には「この現象を理解するためにデータ化したい!」ということしかなかった。仮説を考えずにシンプルな行動原理のみで動いていたこと・じっくりと観察してから調査方法を考えたことが幸いしてか、割とたくさんの興味深いデータが明確な方法に従って集まった。なので、うだつが上がらない修士時代に比して、D1から複数の論文を書き始めることができるという割と充実した状態にあった。
どのようにデータを分割・結合して論文を書くか、について選択肢は2つあった
- 全てのデータをまとめて、ヒグマのセミを食べる行動について網羅的な論文を1本だけ書く。
- データを基に後付け仮説・目的をいくつか造り、それに従ってデータを分割・組み合わせ複数の論文を書く。
自分は後者を選び、結局3本分の論文を書いた。だが書いた後で、前者のような厚みのある論文を書いたほうが満足できたのではないだろうか、と少し考えた。また、前者の場合は自分の初期の考えである「この現象を理解するためにデータ化したい」に準じているため、こっちの方が自分に正直だなとも思った。
そうした思いもありながら、なぜ後者のようにデータを分割して複数論文を書いたのであろうか?その理由は
- 論文数を稼ぎたい(トレーニング・業績のため)
- 仮説検証のようなイントロを書くと、必要最低限なデータだけしか使いにくい。
- あっても論文のメッセージが変わらないデータの組み合わせを避けるため
- 情報過多の現代は論文一本から引用される情報が少ない。
1)論文数を稼ぎたい
これは多くの人から言われてきたことだが、論文は書けば書くほど上達するし自信もつくので、若いころは質にこだわり過ぎずにたくさん書くことを意識せよということだ。論文数が多いと業績評価も高い。論文の質と量はトレードオフ関係にあることが多いので、若いころは、「まだ未熟でトレーニングも兼ねて沢山書くべ」と振り切って量を増やす人は割と多い。
これは多くの人から言われてきたことだが、論文は書けば書くほど上達するし自信もつくので、若いころは質にこだわり過ぎずにたくさん書くことを意識せよということだ。論文数が多いと業績評価も高い。論文の質と量はトレードオフ関係にあることが多いので、若いころは、「まだ未熟でトレーニングも兼ねて沢山書くべ」と振り切って量を増やす人は割と多い。
2)データ使いにくい
イントロは演繹であるため、イントロの最後には「仮説を検証するために(A)***、(B)***、(C)***、という予測を立て、検証した。」という決まり文句が入る。その場合、この仮説に必要最低限なデータ以上を示したら、「仮説と関係なくね??」と言われてしまう。実際に自分の2本目と3本目の論文は修論時点では一つにまとめて書いていたのだが、D1の冬に2本目論文のイントロを演繹的に書いてくにつれ、一部のデータは使えなくなってしまい、そのデータを3本目の独立した論文に回すという形になってしまった。
1本目はヒグマのセミ食いの記載という内容であったため、短いながらその時点での手持ちデータのほとんどを並列して記述できた。
ちなみに演繹的な思考方法は、頭がいい感じに思われがちだが(ロジカルに・・・など意識高そうなアレ)、鍛えれば誰でもできる。社会で役立つと思うので大学院教育では演繹法を鍛える授業くらいやってもいいかも。
3)不要なデータ
これは②と重なるのだが、演繹的に書いてしまった場合、仮説検証と直接関連しないデータは論文のメッセージを変えないため、機能としては不要であるといえる。もちろん純粋に現象に興味がある読者にとってはそんなデータがあると嬉しいけど。ただし冗長なデータは検証を裏付ける意味で大事。
4)情報の波に埋もれる
論文は、まず受理されて日の目に晒されることが重要だが、その次には引用されることが重要だ。今は論文が氾濫しており自分の論文を丁寧に読んでくれる研究者などほとんどいないと思っている。実際にほとんどの論文は要旨とタイトルしか読まれない。その場合、不要なデータとそれに関する考察は誰も見てくれないのではないだろうか?、と考えてしまう。結局仮説の内容しか引用されないのだとすると、無理にデータを詰め込むよりも、仮説とメッセージを決めた後にデータを選び抜いて組み合わせたほうが合理的だ。
しかしある生物の基礎生態が知りたいとき、仮説のためには冗長・不要なデータが重要だったりすることがある。生態学は、システムの理解を深めるのみならず、各種の基礎生態の知見蓄積も重要な使命である。仮説検証を遵守するために仮説と関係ない生物の基礎生態のデータが使われなかったら、若干の本末転倒感が。。。。これは研究者のスタンスや理念が色濃く反映される部分で、一般的な仮説を検証した論文でもMethodsに種の情報を丁寧に書いてくれている論文は割と多い。
データ分割の問題点
1)一部の結果と考察が被る
異なるデータだが同じ現象なので、自ずと重複部分が出てくる。自分の場合、1本目に登場したセミとヒグマのデータが、2本目・3本目でも使われている。(ただしこれは調査年が違う)。2本目と3本目は元々同じ修論にしていただけあって部分的に重なっているため、論文を書くときは結果・考察の一部が重複してしまった。目的・仮説は3本とも異なるし、解析方法や注目する変数が違うにもかかわらず、一部重複してしまった。正直すでに考察していることをもう一度書くのはつまらなかったし、2重投稿しているような気分にもなってしまうのでハッピーな気持ちにはならない。もちろん同じ結果を使いまわしているわけではないので、これは2重投稿には該当しない。次に完全に独立したデータを使った論文を書いたときは気持ちよかった。
2)満足度が低いかも?
最初に書いた通り、素直なモチベーションに従って厚みのある論文を書くのが一番満足できたかもしれない。ただしそういった論文を受け付けてくれそうなのは、生態・進化分野だとEcological Monographsくらいなもので投稿先が見つからない。もうこれは割り切って仮説検証型の論文を書いたことを誇りに思って生きてくしかない。こういった形式で書けそうなのはD論なので、D論書くときに頑張ればいいかも。もしくは本を書かせてもらう機会をいただいたときか。データスプリットが過度だと、ある程度キャリアを積んだときに学生・同僚などから「あなたの懇親の一作はどれ?」と聞かれて困るかもしれない。これとこれとこれと。。。。みたいな感じで、データだけでなくて熱量も分散されてしまうかもしれない。
まだ若いから年食ってからのことは分からないけど、たとえば「**さんといえば、この論文 and/or 生物」という名刺代わりの研究(二つ名的な?)は持っていると学会での存在感が増して、就職・共同研究につながったりすることがあるらしいので、これは満足度以上の影響があるかもしれない。
研究者の退官記念講演を聞いてても、2~3の研究についてじっくりと話すだけだが、すごい厚みのあって情熱にあふれたストーリーで、情熱を注いだ一つの研究さえあれば退職時に格好つけれるのかもしれないと思ってしまった。
3)分割のことばかり考えてしまうかも
分割して論文数が倍になるのであれば、それは何だか得した気分になりそう。いつしか分割して論文数を稼ぐことに執着して、本質的な部分を忘れてしまうかもしれない。なので分割・結合すべきかは、常にデータと論文内容を照らし合わせて最適解を見つけなくてはいけない。 これは個々人の意識の問題。
データ結合の問題点
1)論文数が稼げない
これは今のアカデミアで研究者目指したい人にとっては結構致命的。データを結合させて論文数を少なくして勝負したい人は、常にいい雑誌に狙えるくらいの気持ちでやらないと厳しいかも。論文を書くスキルの上達も遅れるので、本当に質の高い論文だけを書いてやるぞという覚悟で臨む必要があるのかもしれない(お前何様www)。自分はそんなに能力がないから数を稼いでトレーニングしつつ業績積んでいく戦略だが、本当に頭がいい人は割とこのようなやり方でもやってけるだろうし、そういう研究者は多くの尊敬を集めるだろう。上述のようにモノグラフ的な論文を載せてくれるジャーナルが少ないので、投稿先は悩むかも。ただし、1本だけ論文書いて博士取って就職する人は、むしろ思い出の1本として全データをぶち込んだ渾身の論文を仕上げるといいかもしれないし、それは羨ましくもある。
注意:論文をたくさん書いている人が優れているとは考えてない。あくまで今のアカデミアは論文生産性が高くないと生存が厳しいというだけ。
2)引用されない?
データが沢山ある長い論文の方が引用されやすいと思うが、今回のデータ結合とは「仮説検証をやめて、現象を記述するためにデータを総動員する」(分かりにくくてすいません)という意味だから、たぶんこうした論文は情報量が多すぎて、タイトルとアブストだけ読んでも引用すべき箇所が見つけにくい可能性がある。Visibilityという点で、むしろ引用されにくくなる可能性もある。労力の割に引用されにくくなる可能性がある。ちなみに1970年代以前の生態学のいいジャーナルの論文は、モノグラフが割と多い印象で、要旨とタイトルをチラ見しただけでは引用できないことがしばしばある。当時は仮説検証の考えが導入される前だったからだろう。論文にはTake home messageを一言で書けと薦められるが、長い論文だと中々書けないだろう。
ただし、研究者によっては引用できる論文が複数ある時、よりデータが重厚な方を選ぶこともあるらしい。
3)データ埋もれる
(2)とほとんど同じだが、論文の重要なメッセージだけを切り取って引用するので、せっかくのデータが引用されずに終わってしまう可能性がある。この埋もれたデータが独立した論文のメイン図であれば、それはより引用されやすいかもしれない。この考え方だと図を単位に論文を作っていることになるので、論文の構成要素が図であるという考え方と逆かも。
自分は幸い2本目の論文の仮説とのフィット感の都合で封印した解析と図を次の論文のメイン結果として出すことができたが、もし次の論文を出す前に力尽きたら、それこそ本当にでータが世に出ることもせずに埋もれてしまう。これは研究者個々人の責任感に任せるしかないか。。。
どのように自分の論文を読んでもらいたいか?
少数の研究者にじっくりと読んでくれれば満足であれば、引用されにくいようなタイトル・ストーリーになることを承知でデータを統合し分厚い論文を書けばいいし、多くの研究者に浅く読まれて引用されたければデータを分割して書けばいいと思う。もちろん理想的にはゴツいデータで多くの人から引用されるような論文を書くことだろうけど、それは用意周到な仮説検証型研究をまとめることで達成できそうで、後付け仮説検証論文では難しいかも。結局は程度問題。
論文生産戦術のOntogenetic shift
いい仮説を立てて、データを取り、論文を書いていく一連の作業は、相当高いレベルのスキルが必要なので、若いころはとりあえず作業仮説を立ててキチンとした方法でデータを集めて、小分けにして出荷し、博士号を取得。ポスドク経験や就職後、研究に慣れてきたら満を持して仮説検証型研究に取り組むというのは、現実的かもしれない。むろん突然仮説検証を始めようとしても無理なので、若いころから意識して取り組む必要はあるだろう。
欧米の教育
以前欧米の大学でPh.Dを取得した方に欧米の大学院教育について詳しく話を聞くことができたのだが、あっちは演繹的な研究立案をカリキュラムとして有しているらしく、博士1年は課題を決めてレビュー論文を執筆し、D論の第1章作成、2~4年目(4年コースらしい)で1年目に建てた仮説を検証するためのデータ採取・解析を実行し、論文を書く。レビュー論文がうまく書けないと次のデータ採取・解析に進めないらしい。もちろんこれがすべてではないと思うけど、今回自分が考えたような事態にならないような教育システムが欧米の大学院には存在しているということらしい。データは事前の仮説を検証するために存在している感じ。あたりまえに聞こえるが、これがまた難しいんだ。
科学教育として素晴らしいけど、システム化してしまうと学生の個性などがどこで創発されていくのかが気になる。テーマが違うので、研究者としてはニッチ分割できるだろうけど、プロトコルがしっかりしすぎて、研究への向き合い方や考え方、教育方針などのイデオロギー的側面が均質化されてしまうのかもしれない。これは実際に海外に行ってみないと分からないけど。
日本の生態学では、教育という概念が存在してこなかったので、自分のような経験をしている人が多いかもしれない。教育という共通のフィルター・盾がないことは、研究者の個性を多様化させる原動力になる可能性があると同時に、苦しむ学生を多く生むのかもしれない。自分は事前仮説なしで研究を進めてきたが、発見による喜びとたくさんの苦しみを経験できた。それは今後の人生のいい糧になるのではないかと思っている。
まあ、これは研究者教育のスタンスの違いで今回のポストとは関係ない。
長くなってしまったが、最近もやもやしてたから色々と吐き出せてスッキリした。
以
上
コメント
コメントを投稿