Google LensとシリアルとOCR

旅行に行ったときに現地でシリアルを買うのが趣味(?)で、日本では売っていないものを見つけると思わず買ってしまいます。先日、南米に行った際にも1つだけですがシリアルを買いました。スーツケースの時には何箱か買うんですが今回は重量制限等を気にして1つだけです。

f:id:Kishinoshi:20200310001015j:plain — パッケージの表側です。おこちゃま向きだとひと目でわかります

なんとなく、南米でありがちな雰囲気を醸し出しています。まだ食べていないのですが味も想像できます(恐らくは人工的なフルーツフレーバーだと思います)。実際、数年前にアルゼンチンに行ったときにも似たようなシリアルを買ってきたのですが奥さんには不評でした。これもそれと同様な感じがします。

f:id:Kishinoshi:20200310001036j:plain — パッケージの裏側です。何かスペイン語で書いてあります

パッケージがスペイン語なので、なんとなくわかるものとわからないものがあるので、Google Lensで訳してみました。

f:id:Kishinoshi:20200311215406p:plain — Google Lensで翻訳した結果です

いやぁ、すごいですね。見事なものです。パッケージ右上の囲みの中は翻訳されませんでしたが、これは文字として認識されなかったのかなと思います。

テクニカルな話になりますが、OCRでは文字の背景の除去や文字の抽出をするのですが、写真の上の文字とかグラデーション中にある文字データの抽出は非常に難しいのです。あと、縁取りされた文字も抽出が難しいので、ちょっと前のOCRではご認識します。

今のOCRは、というか今のOCRはというかTesseractがというか、かなりの学習の成果がと言ったほうがよいかのかもしれませんが、認識精度が半端ないです。荒れた画像でも文字抽出できてOCRできます。文字の向きとか表組みとかも精度が高いです。さすがGoogle様。大量に学習させたんでしょうけど、既存のOCRベンダはきっと涙目だと思います。

きしのし

定年が近いおっさんの日記です。旅行、鉄道、ポタ、メシ多めです。

Google LensとシリアルとOCR