2690

画像化された文字をテキストデータ化するのにGoogleDriveが割と便利

画像化された文字をテキストデータ化するのにGoogleDriveが割と便利

2013.8.31

Yanobox Nodes中のプリセット名をいちいち文字打ちするのは面倒だったので、GoogleDriveを使ってOCR化してみました。

OCR元となる画像

OCR化する方法

まずはじめに、以下の画像の2箇所にチェックを入れておきます。

チェックを入れたら、画像をアップロードします。以下のようなダイアログが表示されますので、対応する言語を設定し、アップロードをします。

すると、画像アップロード→OCR化→文書ファイルがGoogleDrive上に生成されます。

OCR結果

以下のテキストはOCR結果を貼り付けたものです。OCRによって判断された改行位置なども含めて、そのまま貼り付けてあります。
やはり英語は精度が高めですね。日本語もOCR化はできましたが、手書き文字は無理と思った方がいいでしょう。ワープロ打ちされた読みやすい、印刷画像文字をOCR化するのに使うのがいいと感じました。

あと、やはり間違っている文字も時々あるので本番で使う場合は、必ず目視で確認するようにしましょう。

Built—~in Presets Angel Hair Backbone Ballons Blue Brain
Blue Nodes Circle With Text Constellations Flying Nodes
Green Grid
Grid With Highlight Grid With Image List Hinge Lemon Highlight Network
Nodes Light Rays Nodes Start up
Nodes With 30 Spheres Nodes With Orientation Pandora
Parallel Title
Rainbow
Rainbow Tentacle RCB
Sinusoidal Flower Sinusoidal Flower Close—up Sky noodles
Space Flower Sphere With Depth Sorting Spiral With Clouds
Spiral with Points
Spread Flower
Text Highlight Circle Vertical Modulo Vertical Months Wire Sphere Wire Spiral Words Cloud