このページのリンクから手数料が発生する場合があります。
トレッドミルで走りながらチューブに息を吸い込む私。ウィスニエフスキー医師が検査の様子をモニターしている。 写真提供:ミシェル・ステマン医師
心肺機能を推定できるデバイスは、少なくとも9種類あります。いずれも、科学者がVO2maxと呼ぶ数値で算出します。しかし、実際のVO2maxを知るには、検査機関で検査を受けるしかないので、何をすべきかは分かっていました。その結果から、どのデバイスが最も良い数値と最も悪い数値を出したか、そしてそれが今後の私の(そしてあなたの)トレーニングにどのような影響を与えるかをお伝えします。
テストには、Apple、Coros、Fitbit、Garmin、Oura、Suunto、Ultrahuman、Withings、Whoopのデバイスが含まれていました。Garminのスコアが高かったのは驚きではありませんでしたが、Appleのような他のブランドにはもっと良い結果を期待していました。また、いくつか大きな外れ値もありました。どのデバイスが最も低かったかは、続きをお読みください。
VO2max とは何ですか? なぜ重要なのですか?
VO2maxは心肺機能の指標であるため、アスリートやコーチは長年、VO2maxの数値を知ることに関心を寄せてきました。しかし近年、VO2maxは健康関連の流行語となっています。その理由は理にかなっている部分もあれば、少し誇張されている部分もあるかもしれません。
誇張されていると言うのは、VO2maxはフィットネスの指標の一つに過ぎず、アスリートでさえも万能ではないからです。そして、フィットネステクノロジーで得られる他の数値と同様に、VO2maxがウォッチに表示されるのは、デバイスが簡単に推定できるためであり、必ずしも注目すべき指標だからではありません。(推定値が正確ではない可能性はありますが、それはさておき。)
いずれにせよ、VO2maxが話題になっている大きな理由は、長寿との関連性が指摘されていることです。健康な人はより健康で長生きする傾向があり、VO2maxは、漠然としたフィットネスの概念を分かりやすく数値化してくれます。2016年にアメリカ心臓協会が発表した声明では、心肺機能のフィットネスは、コレステロール値などの従来のリスク要因よりも死亡率のより良い予測因子となる可能性があると指摘されています。
VO2maxは、フィットネスのために自分の体力に関心がある場合にも便利です。ランニングやスポーツが好きな方にとって、VO2maxは有酸素運動における体の適性度を示す指標となり、アスリートとしての成長に直接関係します。
VO2maxが時間の経過とともに上昇していくのは、レースで勝ちたい場合でも、健康的な生活を送りたい場合でも、良い兆候です。スマートウォッチはワークアウトデータに基づいてVO2maxを推定することが多いため、最近ではほぼすべてのウェアラブルデバイスがVO2maxの推定値を提供し、「カーディオフィットネススコア」と呼ばれることもあります。
実際にVO2maxをテストするにはどうすればいいですか?
クレジット: ミシェル・ステマン博士
VO2maxを推定する最も簡単な方法は、時計を見ることです。時計が計算してくれると仮定します。次に簡単な方法は、12分間でどれだけの距離を走れるかを測るクーパーテストのようなフィールドテストを行うことです。しかし、これらはすべて推定値であり、真実に近いかどうかはわかりません。
VO2maxを実際にテストするには、研究室に行く必要があります。そこで、ある晴れた火曜日にセントフランシス大学のヒューマンパフォーマンス研究所まで車で出かけ、クリストファー・ウィズニエフスキー博士とミシェル・ステマン博士にトレッドミルテストを受けてもらいました。
私の場合のテストの流れを説明しますが、ご自身でVO2maxテストを受ける場合は、状況が少し異なる可能性があります。例えば、トレッドミルではなく自転車を使ったり、ウォーキングのみのテストを行ったり、VO2maxセッションを他の健康テストやフィットネステストと組み合わせて行ったりするかもしれません。
検査の48時間前はアルコールを一切摂らないように、最後の12時間は激しい運動をしないように、最後の3時間はカフェインや食べ物を摂らないように指示されました。最後の指示に少しパニックになりましたが、正午の予約時間までには普通の朝食をとる時間は十分にあることに気づきました。運動着で検査に臨み、水筒も持参しましたが、検査中は水を飲むことはできませんでした。今思えば、検査結果を待つ間、軽食も持参すべきでした。
検査室では、予約時に記入した健康診断書の回答を確認し、検査が始まる前に吸入器を2回吸いました(私は軽度の喘息があり、激しい運動で症状が悪化することがあります)。科学者たちは私の体重と身長を測り、検査中に私をモニタリングするための機器を装着し始めました。
心拍数を測るための胸ストラップがありましたが、彼らはそれを「不快なほどきつく」締め付けていることを確認したため、スポーツブラのバンドの下に隠しました。それから、口と鼻を覆うマスクがありましたが、フィットするように測られ、頭の後ろでしっかりと固定するストラップで固定されていました。上の写真でわかるように、これも設計上、不快なほどきつく締め付けられていました。
マスクに取り付けられたチューブは、私が誤解していたように、実際には口の中に酸素を送り込んでいるわけではありません。実際には、部屋の普通の空気を吸っているだけで、吐き出した空気をサンプリングして、酸素と二酸化炭素の含有量を調べているのです。チューブは硬くてスタンドで支えられていたので、トレッドミルの中央にいられるように、時々科学者にチューブを少し左右に動かしてもらう必要がありました。
トレッドミルを使い始める前に、気をつけるべき小さなことがたくさんありました。例えば、走っている間はトレッドミルが見えません。これは、身体的な不快感よりもずっと不安でした。目の前の壁に立てられた標識はトレッドミルのちょうど中心にあったので、それを視覚的な基準として使うことができました。もし中心からずれてしまったら、ステマン医師から少し右か左に動くように指示されました。手すりにつかまりたい時は、手のひらを下に向けて握ると血圧の測定値に影響が出る可能性があるため、手のひらを上にして握る必要がありました。もちろん、ステマン医師は検査中、数カ所でカフと聴診器を使って血圧を測定しました。そして数分ごとに、ウィスニエフスキー医師は私の気分や、1から10のスケールでどれくらい激しい運動をしているかを尋ねました。
時速3.5マイル(約5.6km)の早歩きからスタートしました。3分ごとにスピードが上がり、時速4.5マイル(約7.8km)のゆっくりジョギング、それから時速5.5マイル(約8.3km)のより快適なジョギング、そしていつもの楽なランニングペースである時速5.7マイル(約9.2km)まで上がりました。その後は、スピードを上げる代わりに傾斜が増していきました。最初は5%の時速5.7マイル(約9.2km)で、次は10%の時速5.7マイル(約9.2km)で。最後の段階に入って約1分後、私は諦めて手すりにつかまり、停止の合図をしました。その後は記憶が曖昧です。ウォーキングのクールダウンと、少なくとももう一度血圧を測ったのを覚えています。私が回復し、水を少しずつ飲んでいる間に、ウィスニエフスキー医師が結果を分析してくれました。クールダウンを除くと、トレッドミルに乗っていた時間は16分強でした。
なぜ VO2max はこのように測定されるのでしょうか?
なぜ私がトレッドミルでこれらの機器に取り組まなければならなかったのか、少しだけ技術的な話に踏み込んで説明したいと思います。VO2maxとは、文字通り、運動中に体が1分間に最大(max)に使用できる酸素(O 2)の量(V)のことです。体重1kgあたり、1分間の酸素使用量(ml)で測定されます。(体格の大きい人は、必ずしも体力に優れているとは限りませんが、小さい人よりも多くの空気を呼吸します。そのため、この計算式はそれを考慮しています。)
一般的には「VO2max」と表記されることが多いのですが、今回は科学的に「VO2max 」と表記します。Vの上の点は、総量ではなく、単位時間あたりの量を意味します。ランナーがVDOTスコアについて話しているのを耳にすることがあれば、それもVO2maxの推定値を指しています。
なぜ私たちはあなたが呼吸する酸素の量を気にするのでしょうか?それは、それがあなたの体がどれだけの仕事をしているかを表しているからです。高校の生物で習った呼吸の方程式を覚えているでしょうか?グルコースと酸素がシステムに供給され、ATPという形でエネルギーが供給されます。つまり、酸素消費量を知ることで、あなたの体がどれだけのエネルギーを好気的に作り出し、使っているかが分かります。
したがって、エリートアスリートをトレッドミルに乗せて速度と傾斜を上げると、彼らの体は膨大な量の仕事をこなすことができ、それに見合った大量の酸素を消費し、テストでは高いVO2maxを記録します。
一方、体調が優れず、運動不足の人は、トップアスリートのような運動はできません。早歩きや軽いジョギングはできるかもしれませんが、アスリートほど激しい運動はできず、酸素消費量もアスリートほど多くありません。そのため、最大酸素摂取量(VO2max)は低いと測定されます。
VO2maxは時間の経過とともに変化する可能性があります。運動不足の人がトレーニングを継続的に開始し、数ヶ月後にトレッドミルテストを再度受けると、歩く速度や走る速度が速くなり、傾斜もよりきつく登れるようになるでしょう。テストではVO2maxが向上していることが示されるでしょう。もしかしたら、いつかエリートアスリートになれるかもしれません。
平均的に、若い人の方が高齢者よりもVO2maxが高く(優れている)傾向があり、男性は女性よりもVO2maxが高い傾向があります。エリートアスリートのVO2maxは70~80台を記録していますが、レクリエーションアスリートの多くは30~40台、場合によっては50台です。(参考までに、Garminは年齢と性別ごとに「良い」とされる数値を分類したチャートを公開しています。)
スマートウォッチとフィットネストラッカーがVO2maxを測定する方法
スマートフォンのApple Health、左はGarminウォッチ、右はSuuntoウォッチ。 写真提供:Beth Skwarecki
スマートウォッチ(またはトラッキングリングやバンド)は、あなたがどれだけの酸素を呼吸しているかを把握できません。これらのデバイスのほとんどは、運動強度(例えば、走る速度)と心拍数を比較するアルゴリズムを使用しています。
例えば、Garminデバイスは、少なくとも10分間のアクティビティをGPSで追跡します。Garminは、靴紐を結ぶために立ち止まったり、隣人と会話したりした時間など、アクティビティの中で役に立たない部分をカットすることができます。
GPSデータから、デバイスはあなたの速度を把握します。そして心拍数から、その速度を維持するためにあなたの体がどれだけの負荷をかけているかを知ります。このアプローチは「サブマキシマル」アルゴリズムと呼ばれることもあります。これは、使用可能なデータを得るために最高速度で走る必要がないためです。軽いジョギングでも、GarminやApple Watchはあなたのフィットネスについて多くの情報を得ることができます。心拍数が穏やかで楽なリズムで鼓動している状態で、速いペースで動けるなら、同じペースを維持するために心臓がドキドキしそうな人よりも、はるかに健康である可能性が高いでしょう。
各デバイスは、収集したデータをVO2maxの推定値に変換するための独自のアルゴリズムを備えています。このアルゴリズムは、アクティビティがアルゴリズムに十分なデータを提供できるタイミングを認識することから始まります。これはデバイスによって異なります。Garminは最低10分間のアクティビティを要求しますが、Corosは25分間のアクティビティを要求します。多くの場合、アルゴリズムが作動するには、一定の最低心拍数が必要です。以下は、Appleの開発者向けドキュメントから、アクティビティからVO2maxをいつどのように計算するかを説明した例です。
このシステムは、屋外でのウォーキング、ランニング、またはハイキングワークアウト後にVO2maxサンプルを生成できます。屋外でのアクティビティ中、ユーザーは適切なGPS、心拍信号品質、そして十分な運動量で、比較的平坦な地面(傾斜または下り勾配が5%未満)を移動する必要があります。ユーザーは、安静時の心拍数の約130%以上の心拍数を維持する必要があります。システムはVO2maxを14~60 ml/kg/分の範囲で推定できます。
これらの詳細はデバイスによって異なります。一部のGarminウォッチは、GPSの代わりに自転車のパワーメーターデータを利用できます。これらのアルゴリズムは通常、デバイスが最大心拍数を把握している必要がありますが、デバイスは最大心拍数の推定が非常に苦手です。ただし、デバイスが直接測定するようにプログラムされていれば、直接測定できます。これらのアルゴリズムの1つがどのようなものかについて詳しく知りたい方は、 GarminのVO2maxアルゴリズムを開発したFirstbeat Analyticsが発表した論文をご覧ください。(ここで説明されている詳細が、Garminウォッチが現在使用しているものと全く同じかどうかは不明です。)
しかし、VO2max の推定方法について詳細を提供しないデバイスもあれば、運動データをまったく収集せずに数値を提供するデバイスもあるようです。たとえば Whoop は、「スコアを計算するために、アルゴリズムは継続的な生理学的データ (安静時の心拍数と心拍数変動を含む)、運動パターン、および GPS 追跡パフォーマンス メトリック (有効になっている場合) を考慮します。また、VO2 Max が加齢とともに自然に変化するかを考慮し、身長、体重、生物学的性別など、酸素利用に影響を与える身体的要因も組み込みます」と述べています。私の Whoop アプリは、VO2max の推定値を向上させるために GPS 追跡アクティビティをもっと行うように指示しますが、同社の発表によると、アプリは GPS データがない場合でも数値を提供する可能性があるとのことです。
Ouraは、私がテストした他のデバイスとは少し異なります。通常のワークアウトからVO2maxを推定するのではなく、6分間のウォーキングテストを行うように促します。このタイプのテストは医療分野ではよく知られており、不完全ではあるものの、 VO2maxの推定に使用されてきました。
しかし、これらすべてについて忘れてはならない悲しい事実があります。フィットネスウォッチの実際の精度について言えば、科学的な判断を下すのに十分な情報が不足しているのです。この問題については以前ここで論じました。デバイスメーカーは、自社の指標を検証したり、その方法論を公開したりする義務がありません。彼らはただ、好きなデバイスに好きなアルゴリズムを組み込んで、あとは私たちが気になれば調査するだけです。科学者が研究を設計し、実施し、結果を報告する頃には、十分な時間が経過し、テストしたモデルが時代遅れになっていることがよくあります。
スマートウォッチによるVO2maxの推定値に関する研究では、一般的に、その推定値は実際のVO2maxの測定値と相関関係にあることが分かっています。つまり、スマートウォッチの推定値が高いほど、同じ人の実際のVO2maxの測定値も高くなるということです。しかし、正確な数値は大きく異なる可能性があります。例えば、 Apple Watch Series 9とUltra 2に関するこの研究では、「フィットネスレベルが良好または非常に高い人の場合、Apple WatchはVO2maxを過小評価する傾向が見られ、フィットネスレベルが低い人の場合、過大評価する傾向が見られた」と結論付けられています。
私の結果と優勝者
クレジット: ベス・スクワレッキ
トレッドミルテストを終えて間もなく、正式な検査結果が届きました。その後、自宅で最近使っている様々なフィットネストラッカーをじっくりと見てみました。Garmin Forerunner 570 のようにレビュー用にテストしていたものもあれば、 Oura ringのように個人的なデバイスとして習慣的に使っているもの、そして以前のレビューテストで使っていたものもありました。まだレビューを終えていないデバイスもいくつか紹介しているので、これはちょっとしたおさらい程度に捉えてください。
これまでのところどう思いますか?
最近データがなかったデバイスについては、必ず1~2回ランニングして再調整を行いました。同じブランドのデバイスを複数使用していた場合は、すべて同じアプリまたはアルゴリズムにデータを入力していたため、結果はデバイスではなくブランド別にまとめています。使用したデバイスの完全なリストは、この記事の下部にあります。
ラボで測定された私のVO2maxは42.8 mL/kg/分でした。これはウェアラブル機器から得た推定値のほとんどよりも高かったので、多くの人が思っているよりも良い健康状態にあるようです。とはいえ、私の数値を過大評価した人もいました。Garminはわずか1ポイント、Whoopは約3ポイント、Ultrahumanは驚くほどの差がありました。以下は、それらの全リストです。近い順に並べています。
VO2maxテスト値: 42.8
ガーミン:44(1.2ポイント高)
Fitbit : 41 (1.8ポイント低)
スント:40(2.8ポイント低)
フープ:46(3.2ポイント高)
Apple Watch:37.9(4.9ポイント低)
コロス:37(5.8ポイント低)
大浦:37(最低5.8ポイント)
Withings : 36 (6.8ポイント低)
ウルトラヒューマン: 61(18.2ポイント高)
ガーミンはVO2maxを44と推定し、実測値よりわずか1.2ポイント高い結果でトップに立った。ガーミンは私の最大心拍数を正確に把握しており、5kmレースの推定タイムも実測値に かなり近いことが既に確認されていたので、かなり良い結果が出るだろうと期待していた。
Fitbitが次に来るとは思っていませんでしたが、Fitbit、よくやった。他のレビューではSuuntoのVO2max推定値がかなり正確だと評価されていたので、まだ数ポイントの誤差はあったものの、Suuntoの好成績は嬉しかったです。
その後、Whoop が 3 ポイント高い 46 という推定値で際立っています。Whoop はVO2max を推定する方法を具体的には明らかにしていませんが、運動データをまったく必要としないと言われているため、私はあまり信頼していません。(テスト中に GPS データをいくつか入力したので、推定値の精度が向上したとのことでした。)もしこれが推測だとしても、少なくとも納得のいく推測です。
Ultrahumanの推定値はあまりにも的外れなので、リストに入れないところだった。Ultrahumanリングのテストを始めたのは数日前で、まだ2回のワークアウトしかしていないのだが、リストの他のデバイスはどれも、最初に数値が表示されたときには妥当な推定値を示していた。設定を確認したところ、Ultrahumanが計算する最大心拍数は編集できないことがわかった。これがVO2maxの推定精度に影響を与えているのかもしれない。しかし、Ultrahumanアプリが設計上の都合で精度の低いデータに基づいて動作しているのであれば、提示された数値を使うのは不公平ではないだろう。そのため、リストに入れ、懸念を表明した。
残りはどれも5ポイント以上低すぎます。もしApple Watchを信用していたら、自分の健康状態を実際よりもずっと低く評価していたでしょう。Coros、Oura、Withingsと同様に、Apple Watchも30台前半の数値を示していました。正直、これらの数値にはあまり感心できません。
制限事項
私の結果に関する最大の注意点は、私がたった一人の人間であるということです。同じ実験を100人の異なる人に対して行ったとしても、全員が同じ結果を得るとは限らないでしょう。若いアスリートにはより正確なデバイスが、一般の人にはより正確なデバイスが、生まれつき心拍数が高い人や低い人にはより正確なデバイスが、といった具合です。デバイスは変化し、ソフトウェアもアップデートされます。私の結果は、ある人が特定のデバイス群 を使って、ある日のスナップショットとして捉えてください。
各デバイスのVO2max推定値には、必ずしも私が把握していない独自のパラメータがあります。各アプリには、正確な(またはほぼ正確な)体重、年齢、そして可能であれば最大心拍数を入力するよう最善を尽くしました。しかし、各社が計算に使用する変数を全て公開しているわけではないため、入力して再確認できる数値の完全なリストがありません。
たとえ最善を尽くしたとしても、完璧なテストなど存在しません。VO2maxテストを別の日に、あるいは別の検査機関で受けていたら、結果は多少違っていたかもしれませんし、順位も全く同じではなかったでしょう。
デバイスの VO2max スコアはどれくらい役立ちますか?
正直に言うと、ここまで科学的な考察をしてきた中で、実践的なアドバイスを4つの言葉にまとめると、「数値を上げましょう」です。VO2maxが実験室での検査結果であれ、スマートウォッチの推定値であれ、運動量を増やし、より一貫して行うことで、数値は上がる傾向があります。
数値が増加している、あるいは比較的高い数値で安定している場合は、おそらく何か正しいことをしているのでしょう。もし時間が経つにつれて数値が減少するなら、もう少し有酸素運動をすべきだと捉えてみてはいかがでしょうか。
(体調が良くなっていると感じても、ウォッチの推定値が高くならない場合は、特定の距離を走った時間を計測するなど、別の方法でフィットネスをテストして確認するか、以前に行ったトレーニング中にどのように感じているかを測定し、それが時間の経過とともに改善されるかどうかを確認します。ただし、通常は、これらのVO2max推定値の変化は、フィットネスの向上に伴って期待されます。)
これらのデバイスのほとんどは、VO2maxの推定値に加えて、自分のVO2maxが、同じ性別や年齢層の他の人と比べてどの程度優れているかを教えてくれます。Garminでは私のVO2maxは「優秀」と表示され、一度だけ一瞬「優れている」というスコアが出たこともありました。Appleでは私の心肺機能は「高い」、Ouraでは私の心肺機能は「ピーク」、Suuntoでは「優秀」と表示されます。
これらの範囲の境界がどこにあるかについてあまり議論するつもりはありませんが、検査結果から私が中年女性コホートの96パーセンタイルに位置すると判断されたことを考えると、妥当な判断だと思います。書類上は素晴らしいように聞こえますが、実際の私のランナーはごく平均的です。「年齢と性別において」というアスタリスクが、大きな役割を果たしているのです。
でも、少し立ち止まって考えてみましょう。VO2maxは単なる数字です。私の人生の本当の目標は、健康で幸せでいること、そしてもしかしたらご褒美として5キロのタイムを縮めることかもしれません。もし私が、この辺りの人たちのように真のマゾヒストだったら、マラソンをもっともっと速く走りたいという思いも加えるかもしれません。
VO2maxはこれらすべてに関連しますが、厳密には同じではありません。VO2maxが高くても健康上の問題を抱えている場合があります。アスリートは、実際のレースタイムがVO2maxテストの結果よりも速かったり遅かったりすることがよくあります。コーチは単に「VO2maxを上げましょう」と言うだけではありません。乳酸閾値、ランニングエコノミー、精神力、脚力など、ランナーに数多くのトレーニングをさせます。
健康とフィットネスは多面的な要素を持ち、一つの数値で表すことはできません。そのため、VO2max(またはスマートウォッチによる推定値)を有酸素運動能力の指標として用いることはできますが、これは直接的な測定値ではありません。また、特定のVO2max値に達したからといって、特定の健康状態や寿命が保証されるわけでもありません。
私が使用した特定のデバイスモデル
複数のデバイスが同じアプリやアルゴリズムにデータを送信している場合があります。例えば、同じアカウントに3台のGarminウォッチをリンクしている場合でも、Garmin Connectアプリと各ウォッチに表示されるVO2maxスコアは1つだけです。各ウォッチのスコアが互いに矛盾することはありません。
過去にこれらのブランドの他のデバイスもテストしたことがありますが、同じブランドであればデバイス間で大きな違いは見られませんでした。例えば、Fitbitアプリで確認した有酸素運動のフィットネススコアは、Charge 6を装着していてもPixel Watch 3を装着していてもほぼ同じでした。そのため、デバイスごとではなくアプリごとにスコアを報告することに自信を持っています。
それを念頭に置いて、以下のリストには、各ブランドの推定の主な情報源として、私が VO2max ラボ テストの頃に使用したデバイスが含まれています。
Apple Watch:シリーズ10(GPS + セルラー、42 mm)
Coros : Pace 3 (最近はあまり使用されていない: Pace Pro)
Fitbit : Fitbit Charge 6 (最近あまり使用していないもの: Pixel Watch 3)
Garmin : Forerunner 265S、Forerunner 570 42 mm。(最近はあまり使用していません: Vivoactive 6 )
Oura : Gen 3 (最近はあまり使用されていない: Gen 4 )
スント:スント ラン
Withings : スキャンウォッチ 2
フープ:フープ 4.0
ウルトラヒューマン:リングAIR
各デバイスからVO2maxの最新の推定値を、VO2maxラボテストから約1週間以内(都合の良い方でテスト前またはテスト後)に取得するようにしました。唯一の例外はWhoopで、最新のVO2max推定値を取得するには14日間の睡眠データが必要です。Whoopで最後にVO2maxを推定したのは、VO2maxラボテストの3週間前でした。