【ウェブアクセシビリティ座談会 No.8】大したことないかどうかは、俺たちが決めるんだ〜技術の進歩で情報の受け取り方が増える〜

2022年12月8日

ウェブアクセシビリティってなに?うん、うん?うん!と聞いているだけでウェブアクセシビリティがわかる座談会第8回
よっこ
この記事は「アクセシビリティ Advent Calendar 2022新しいウィンドウで開く」8日目の記事です。

まずは座談会メンバーの自己紹介です!

くらげ
サニーバンクアドバイザーのくらげです。聴覚障害とADHDの当事者です。この連載はアクセシビリティとはなにかをお話しながら理解を深めていこうという企画です。まずはいつものメンバーの自己紹介からお願いいたします。
よっこ
サニーバンクスタッフのよっこです。主にアクセシビリティ関連の案件を担当しています。
伊敷
伊敷政英(いしきまさひで)です。先天性の視覚障害当事者で、サニーバンクでは主にアクセシビリティ関連のアドバイザーをしています。
寺島
サニーバンクアドバイザーの、寺島です。発達障害のある2人の子どものママで自身も強いASD傾向があります。漫画家をやっておりまして、このコラムではイラストやアイコンも担当しています。

全文文字起こしか要約筆記か、手話か

よっこ
サニーバンクではUDトーク新しいウィンドウで開くというアプリを利用した「リアルタイム字幕提供サービス」を行っているのですが、「リアルタイム字幕提供サービス」ではUDトークによる自動音声認識に加えて、サニーバンクのワーカーさんが誤認識の修正を行うことにより、より正確な字幕を提供できるようにしています(リアルタイム字幕提供サービスの活用事例参照)。ただ、修正を行うまでは誤認識のまま、言い間違いなども含めて全部文字になってしまうので、場合によっては修正されたものを読み直す必要があったりもします。と考えると、手話通訳や要約筆記に比べて、利用する方は大変な面もあるのかなという気がするんですけど、どうですか?
くらげ
それは聴覚障害者でも人によって随分と意見が変わってしまいそうな…。UDトークは話したことを全部自動的に文字にしたものを修正して伝えるので確かに文字が膨大な量になってしまうんですよね。そういう意味では大変なのは間違いないんです。要約筆記は要約者が文字通り要約をするのでコンパクトにはなるのですが、どうしても要約者の解釈が入ってしまうので、要約者の技術や知識にも左右されてしまいます。個人的には情報保障は正確な情報をそのまま伝えるのが重要で、情報量は多ければ多いほど良くてそれをどう解釈するかは障害者側の責任だと思っています。そういう意味ではUDトークのほうが私はありがたいかな…。
寺島
今の話を聞いていて思ったんですが、障害があるという人が会議などに参加したときに「今日は漏れなく聞きたいな、だからUDトークのほうがいいな」という時もあれば、「今日の内容はざっとで良い、要約筆記のほうが助かるな」という時もあるんじゃないかなと。でも誰かに支援をしてもらうという立場だと「今日はざっとで良いですよ」とか、その場で選びにくいのが問題なのかもしれないです。いろいろな情報保障があるならその中から自分に最適なものを選べるんですが、現実問題としてそうするのは難しいわけですよね。だから、要約筆記とUDトークのどっちが優れているか、という話には本来ならないのではないのかなと。
よっこ
そうですよね!自分がどういうふうにセミナーとかに参加しているか考えると、この人の話は細部まで聞きたいから全部の発話に集中しようとか、この内容ならお話はリラックスして聞いていいかなとか、そういうのありますあります。その感覚と、全文文字起こし、要約筆記がそれぞれあっている感じがします。
今やっているドラマ「silent」で、先週、聴覚障害のある奈々さんが大学生の時の話がありました。大学の講義の時に、パソコンテイクといって、講義で話されていることをパソコンで文字にしてくれるボランティアの人に「授業サボりたいです」「いつも隣に人がいるから、みんなみたいにゲームしたり寝たりできない」と言ってたのを思い出しました。サポートが受けられるのはいいなと思っていたんですが、なんかそういうの、上手く言えないけれどあるんだなと思って。
やっぱり、全文文字起こしも要約筆記も手話も、情報を発信する側が、受け取る側に必要とされるであろうものを全部提供して、好きなものを選んでもらえる、というのがいいのかなと思うのですよね。なかなかそうはできないのが現実なのですけど。
くらげ
なんにせよ情報保障を行うには人手がいるということがあります。他人が絡むと自由度が下がるというか…。UDトークも正確に情報保障を行うには修正が必要になりますが、基本的には自動的に文字化しているわけです。スマホやタブレットがあればある程度は自分で情報保障ができる、ということが大事で、技術的な面で情報保障が行われるという良さはそこにあるんじゃないかなと。
伊敷
要約する人の解釈という意味では視覚障害の世界でもやはりあって、自治体の広報誌の中には要約された点字版や音声版が作成されていたりするんです。多くの情報の中から視覚障害のある人と関係が強そうな内容を取り上げていただいているとは思うのですが、なんかもやもやするというか、やはり全部知りたいですね。
よっこ
私は伊敷さんと一緒に仕事をすることも多くて、資料を共有する時にどこまでテキスト化すればいいのかな、といつも考えます。私自身は基本、私が受け取る情報は全部知って欲しいというのがあって、特に伊敷さんにはスペルミスとかも含めて伝えたかったりします(笑)。だから全部テキスト化して伝えたいんですが、十分に時間が取れなかったり、技術的に難しかったりして、「全部」とはできない時もあるんですよね…。
伊敷
以前、仕事で使う資料が送られてきたんだけど、内容が読めなくて担当者に「これ、書いていることが読めないからテキストにしてください」と頼んだところ、担当者は「あ、これは大したこと書いてないので気にしないでください」といわれました。そのあと、これを聞いていた別の人がテキスト化してくださったんですが、今後のスケジュールなど、めちゃくちゃ重要なことが書かれていて「全然どうでも良くない」と思いましたよ。疎外感も感じましたね。
くらげ
たいしたことはないというと、聴覚障害者が特に雑談とかだと他の人が話してることがわからなくて「今何と言ったの?」と聞いても「あ、大したことはないから」と特に伝えてくれなかったりするんですよね。あれはちょっと疎外感を感じるからやめて欲しいんですけど、実際全部通訳するのも大変なのでその塩梅って難しいなと思います。
ここまでのおはなしをふりかえるイラスト:寺島さんがくらげさんの背中にiPadを押し付けているイラストには「誰にとって良いもの?選べるのが嬉しい・どんなに便利なものでも押しつけになってはいけないですよね」という言葉が、よっこが渡した書類に伊敷さんが「これで全部?本当に?」と心配しているイラストには「大したことない情報かどうかは自分で決めたい・どれぐらいの精度で情報を渡すのが良いのかいつも考えてしまいます」のことばが添えられています。


音声認識や画像認識・OCRの技術などが進歩している!

よっこ
そういえばくらげさん、新しくPixel7を買ったそうじゃないですか。私もPixel6を持っていて音声認識機能に感動したんですが、くらげさんもPixel7の音声認識がすごいっておっしゃってましたよね!
くらげ
Google が作っているPixelというスマホがあるのですが、Pixelにはスマホで流れている言葉を自動的に文字起こしできる機能が標準搭載されているんです。でも、日本語に対応しているのはPixel 6以降のものだけで、Pixel 4しか持っていなかった私は使えなかったんです。いい加減バッテリーもへたってきたし、キャッシュバックキャンペーンもあったので思い切って買い替えてしまいました。この座談会もPixel 7から文字起こしつつ聞いているんですがオンラインミーティングの気分的な負担が減りましたね。
よっこ
この座談会をやる時はUDトークによる字幕もつけるようにしていますが、UDトークにしてもPixelにしても、いつも持ち歩くスマホで、精度の高い音声認識による字幕が使えるのはとてもいいですよね。機能もどんどんよくなっているみたいなので、さまざまな面で技術的に解決できていくことも増えていくんじゃないでしょうか。
くらげ
最近は PDF や画像から簡単に文字を切り出したりできる技術も進化していますよね。そういう技術を伊敷さんも使ったりされますか。
伊敷
OCRの機能は確実に進歩しているし、ハードウェア製品だけでなくスマホアプリもたくさん出てますね。ただテキスト化したものを意味が通るように並べて文章にしたりするのはまだ難しいかな。
寺島
でも、音声を文字起こしする技術と同じように、画像認識や解析の技術もどんどん上がっていますよ。私はiPadを持っているんですけど、例えば「Wi-Fiが使えます」というお店で実際にネットに繋ごうとすると、パスワードをポチポチと入れなきゃいけなかったりしますけど、最近は壁に書いてあるパスワードを写真に撮って、文字を取り込んでコピペすることができます。最初にこの機能に気がついた時は感動しました。入力の手間が随分省けます。
よっこ
文字を取り込んでテキストにするだけではなくて、翻訳もしてくれたりしますよね。可愛いお酒の瓶に貼ってあった英語のラベルにPixelのカメラをかざしたら、全部日本語に訳されて感動しました。
寺島
Googleの中の技術もここ10年ですごく進んでいて、私が10年前に絵日記ブログを始めた時には漫画を画像として上げていても「ブログにコンテンツがない」と、アドセンスを断られるぐらいだったんです。でも、2年ぐらい前から漫画の中に書いてある文字を認識して「コンテンツがある」と認められるようになりました。漫画の中に書いた手書きの文字もGoogle の検索結果に出てくるようになってるんですよ。
伊敷
漫画とか絵日記の中の画像からテキストを読み取ってGoogleの検索の結果に出るのか、すごいな。
くらげ
自分は写真の管理にGoogleフォトを使ってますけどもう30GBくらい使っているんですね。 整理はできない量ですけど、「空」とか「海」とかで検索するだけで写真が出てくるので助かっています。
寺島
人の顔も見分けて、名前を入れれば同じ人の写真を全部検索して出してくれたりもしますよね。AIによる画像解析は本当にすごいところまで来ていて、代替テキストを入れていないイラスト画像も AIに分析させれば何が描かれているか「読めちゃう」ということもあります。アクセシビリティ的には良いことなんですが、モノの要素だけを勝手に抽出されると、作者が意図したイメージを届けることができないのではないかなどの心配もあります。
よっこ
そういう意味でも、提供する画像にその作者が適切な代替テキストを入れるって大事ですね。
くらげ
そういえば、私の使っているカーナビはAI搭載型で色々しゃべるんですが、声も男性や女性に変えたり、声優の声を選べたりするんです。最初の頃は女性のしか選べなくて、更に妻のあおが同乗して聞いていると音が突き刺さって少し辛い、といっていたんですね。でも、最近バージョンアップして随分と音が良くなったし、私が聞きやすい男性の声に変えることもできたので利便性が上がりました。
伊敷
それは「支援技術の進歩」という観点でとても大事な進歩ですね。移動中ずっと不快な音声を聞いていないといけないのは耳にも精神的にもつらいですね。
寺島
YouTubeが流行ってきた頃に「ゆっくり」という合成音声エンジンが使われ始めましたが、発達障害者には抑揚がないのであの音が聞きやすいという人が多かったんです。最近は高性能な「ボイスロイド」というのがよく使われてます。
伊敷
僕も「ゆっくり」の音声は聞きやすいし長時間聞いていても疲れないので好きです。あとボイスロイド、あれすごいですね。初めて聞いたときびっくりしました。本当にいろんな分野で技術的な進歩が進んでいますね。

技術の進歩によって障害が障害でなくなる日も近い?!

寺島
でも、そういう機能があることを知らないとか、知っていても使えないとか、そういう問題はありますよね。
くらげ
まさにデジタルデバイド(情報格差)の問題ですよね。技術があっても使いこなせないと意味はないので、当事者の間でもどうすれば技術を使いこなせるのかを考えないとだめなのだろうな、と思います。
よっこ
それと、 iPhoneやiPadも値上がりして10万円以上とかしたりするじゃないですか。iPhoneやiPadが1台あればできることが増えるのに、それを買うのが難しいという方も多いと思います。
くらげ
視覚障害者向けにiPadの購入に補助が出る自治体とかありませんでしたっけ?
伊敷
iPadと視覚障害者をサポートするアプリをセットで日常生活用具の対象にしますという自治体は実際はいくつかあって、八王子市が最初に取り組みを始めたと思います。また、鳥取県ではiPhoneやiPadだけでも支給対象になっていますね。
寺島
iPadは一般的なスマホより画面が大きいですし、PCより軽いので、私は普段から障害者のみならず、高齢の方にもおすすめしています。 iPadがあれば障害のある方が出来る事ってめちゃくちゃ増えると思うんですよ。もともと脳神経外科をやってた先生がギランバレー症候群になってしまって、それをきっかけにアクセシビリティをテーマに活躍されることになったのですが、そのツールとして活用しているのがiPadだという話なんです。「闘病した医師からの提言 iPadがあなたの生活をより良くする」という本も出版されていますね。もう、命の次にiPadが大事みたいな(笑)
くらげ
iPadに限りませんけど、さまざまな面で便利になっていくのはまちがいないでしょうね。
よっこ
技術を使いこなせるかやお金の面での問題もあるとはいえ、技術を利用することで今「障害」になっていることが「障害」でなくなる時がくるかもしれませんよね。サニーバンクのワーカーさんの中には、さまざまな技術を便利に使いこなしている人も多いと思うので、そういうのを聞いてみたいなと思いました。

これまでの座談会

ページトップへ移動