11月7日および11月16日の続きである。
16日の結果で、映像が鮮明であればかなりの精度で文字を認識することが分かった。
しかもそれは、縦書き日本語でも可能であった。
この結果に基づき、ホーキング博士の論文に再度挑戦することにした。
7日の結果には問題が2つあるように思われる。
1つは映像の鮮明度、これはすでに述べた。もう一つは、映像を日本語として認識している様子が伺える。ここでは英語として認識してほしい。
認識を切り替えることはできないのか?
ネットで調べたが分からない。
あきらめかけていた時偶然に見つかった。ちゃんとあった。画像を右クリックしたとき表示される枠の最下段に「画像内のテキストを検索可能にする」の表示があり、これをクリックすると日本語と英語の切り替えができるのである。
映像は画像編集ソフトで可能な限り鮮明にした。そして、認識も英語に切り替えた。
その結果である。
右上段はOCRで読み取ったそのままの英文。7日に比べると英文としての認識が格段に上がっている。
これを手動で修正したのが下段。原文を最初から入力するのに比べると必要な手間はかなり少ない。
OCRの成果は十分にあると判断された。
この英文を10月23日に述べた「グーグル翻訳」にかけてみた。
論文の主旨は大方理解できる。もともと論文そのものが難解なわけで、識者日本人が完璧な日本語に翻訳しても、我々凡人が理解できるものではなかろう。
OCR機能と自動翻訳の機能を利用すれば、紙に書かれた英文を日本語として読むことが出来る、という証明にはなった。
有難いことである。
|