手術室でも医局でもない、
外科系医師に開かれたオンラインでの研鑽場所

【康永秀生先生 #03】リアルワールドデータを用いた観察研究

本編に登場する論文

Postoperative polymyxin B hemoperfusion and mortality in patients with abdominal septic shock: a propensity-matched analysis
Masao Iwagami, Hideo Yasunaga, Kent Doi, Hiromasa Horiguchi, Kiyohide Fushimi, Takehiro Matsubara, Naoki Yahagi, Eisei Noiri
Crit Care Med. 2014 May;42(5):1187-93.

── DPCデータを用いた多くの共同臨床研究が進むようになり、今回ご紹介いただく論文もその中の1つですね。

はい、指導者として教え子にいろいろ教える立場になり、SPHを卒業した腎臓内科の岩上正夫先生が執筆してくれた感慨深い論文です。
日本で開発されたエンドトキシン吸着療法(以下PMX)の治療効果に関する論文なんです。

── PMXは日本発だったのですね

はい、それで敗血症の患者さんにはPMXということで日本ではよく使われているのです。保険適応にする際に根拠となった治験は、コントロール群もなくて数十例にPMXを使用してみたら血圧が少し上がった、とかその程度のものでした。
1990年代の事なのでそれはしょうがないんですけど その後も全く再検証がされていないで日本で普及していたのです。

── そうだったのですね

その後に販売元の東レがイタリアでRCTをやるっていって、結構話題になったんですよ。ところが、そのRCTの結果が非常に期待されつつ、JAMAに掲載されたのですが、、、
問題点を多く指摘された論文でした。
RCTの症例数が64名ぐらいでして、割付も何だかうまくいってないような感じでした。
また、死亡率が異常に高かったんですね。

── たしか50%とか、そういう感じでしたか。

そうです。
いくら重症敗血症っていっても、死亡率50%って高すぎるだろう、と。
これはやっぱりおかしいんじゃないか?と私が思ってたところ、岩上先生もPMXの治療効果を再検証しないといけないと彼自身も思っていたんです。
それで一緒に研究デザインを考えてですね。
彼とこのDPCデータを使ってエビデンスを出すためのデザインや統計手法のディスカッションを入念にしました。
あの当時のディスカッションの内容を今でもSPHの講義の資料に使ってるぐらいです。

臨床現場の専門家の肌感覚が大事

── どんなディスカッションだったのですか?

どうやって交絡因子を調整するか?とかですね。
交絡因子候補をみつけだしてくるのは文献レビューが必要なんですけど、やっぱりその道の専門家の先生じゃないとわかんないわけですね。
何がアウトカムに影響してるとか、どういう患者さんには効きやすい・効きにくい、とかですね。
専門の診療科の医師はそれを肌感覚で知っているわけですよ。
その肌感覚で知っていることを、いかにデータを使って分析するかというところが肝なのです。

この論文の結果では死亡率に有意差なしとなり、JAMAの論文と全く違う結果になっちゃったわけです。
Critical Care Medicineという集中治療の専門誌に投稿し、何人かのReviewerがつきましたが、そのうちの1人が敵意むき出しの激しい批判コメントを寄こしました。冷静に反論コメントを返し、論文を修正し、最終的にアクセプトされました。後になってわかったんですが、このレビュアーが実はJAMAの論文の筆頭著者だったんです。

── なんでわかったんですか?

もちろん、ブラインドレビューなのでレビューの段階ではわかんなかったんですよ。
気がついたのは、その後に論文が出た際ですね。
我々の論文が出たのとおなじ刊行物にCorrespondeceみたいなのが載っていて、それを書いたのがJAMA論文の筆頭著者のDinna Cruz氏で、内容が我々に送ってきたレビューアーコメントと同じだったんです。

── ははは

この人だったのか、と。

そういう激しいバトルがあって、やっとアクセプトされたような形ですけど、そのあとに他の研究者からの追試があってですね。
フランスでもう一度大規模なRCTがあって、そこでnegative studyとなりました。
その後に北米でもっと大きなRCTをやられてて、それでもnegative studyになったんですよね。

── 先生たちの論文が支持されるような結果だったのですね。

特に北米のRCTの結果では、我々のDPCデータ研究の結果を再現するような結果になっていました。
きちんと研究をデザインし交絡因子を可能な限り調整した観察研究の結果というのは大規模なRCTとほぼ似たような結果になると、ある意味証明できたんじゃないかと。
そういう意味で思い出に残る論文ですかね。

── RCTの結果を再検証されていて本当にすごいです。
従来のエビデンスピラミッドの影響か、RCT至上主義のような考えもあるかと思いますが、、、クライテリアの厳しいRCTだと日常で治療をおこなっている患者さんとは大分異なる対象だったりするので、そういうRCTの結果ってそのまま信じていいのかってなりますね。

そうですね。そういう意味ではあの最初のJAMA論文の評価も昔だとエビデンスピラミッドの頂点ですので、われわれの観察研究が勝てないわけです。
GRADEシステム(The Grading of Recommendations Assessment, Development and Evaluation)ができてから、ずいぶん変わりましたよね。
RCTであっても質の低いものはレベルをどんどん下げていく、逆に観察研究であっても 質の高いものはレベルを上げる、という考え方になってきています。
そのGRADEシステムを採用するようなガイドラインはどんどん増えてきてるんですよね。
例えばUpToDateも採用してますよね。

── なるほど。
個人的には倫理委員会で治験をたくさんやっている先生に、観察研究なんかやって意味あるの?と観察研究軽視な言葉を浴びせられたことありますが、、、

それをやっぱり我々の世代、それに続く次の世代で変えていってほしいですかね。
我々が変えるきっかけを作ったような世代で、その次の世代はですね、もっともっとそれを広めたリアルワールドデータでの観察研究を進めていってほしいです。
それはDPCデータだけじゃなくて、疾患特異的レジストリ研究ですかね。
整形外科だったら、もっと整形外科特有のレジストリがあったほうがいいと思うんですよ。そういうリアルデータを用いた観察研究で色々なエビデンスを表現していってほしいですね。

── ありがとうございます。

── 先生方は新しい統計技術をリアルワールドデータベース研究に応用されていますが、最新知見をどうやってキャッチアップされているのでしょうか?

医学医療において、臨床の技術もどんどん進歩していきますよね。
それと同じで統計技術も進歩していくわけですよ。
統計には統計専門のジャーナルで、Statistics in Medicineとかがあります。
うちの教室のメンバーたちは、新しい統計手法がでてきたら、いち早くキャッチアップしてますね。
新しい統計手法が導入された時期は割とJAMAやLancetに出たりするので、教室の皆で抄読会をやって知識をシェアしています。
自分たちだけがわかってもそれでは結局一般には普及しないですから、臨床の先生にもわかるような言葉で本を書いたりセミナーを開いたりとか、まあ地道に活動はしてますかね。

── 素晴らしいです。
先生の教室から論文がたくさん出ています。
臨床家の医師とうまく共同研究をやるシステムが構築されているからでしょうか。

論文がジャーナルに載るのは必ずしも統計分析が優れているからではないですよね。
やっぱり、臨床的に重要だとか、臨床現場の先生が非常に興味を持っている、とかですよね。
そういった視点で特に臨床系ジャーナルは採否が決まりますので、つまりネタが大事なんですよね。

── はい。

それで統計手法がいくら優れているからって臨床のネタがあんまり面白くないとやっぱり採用されないわけです。
けど、それでもどこかのジャーナルは拾ってくれるわけですね。

僕自身の考え方はですね、若手研究者には研究成果を必ず論文にまとめ上げることを課す、トップジャーナルじゃなくても、必ずピアレビュージャーナルにアクセプトされるまで論文執筆を指導する、という信念はつらぬいてます。
そういう方針なので、ハイインパクトジャーナルにももちろん掲載されているけど、ローインパクトジャーナルにもいっぱい出てるんですよ。
それらも合わせて年間6-70本論文を出しています。
まあせっかくやった仕事だから発表すべきですし、ローインパクトジャーナルの論文でもひょっとして誰かが読んでくれて臨床の役に立つ可能性だってあるわけですから。
まあそんな感じでやってますね、はい。

こちらの記事は2020年12月にQuotomyで掲載したものの転載です。