【Lesson 7】ひらがなOCR実験中!📷【Python】

ちびキャラのAIアシスタント“ゆら”と、ミントグリーンのへびが夜空の中で並ぶ「ColabではじめるPython入門」のアイキャッチ画像 Python
ColabではじめるPython入門|ちびキャラゆらと学ぶ、やさしくて楽しいプログラミングの第一歩。

こんばんは、しおるです🔰

ひらがなOCR実験の途中経過です。

📝 はじめに

今回は「Pythonで手書きのひらがなをOCRで読み取れるようにしたい!」という挑戦を始めました! Python + Tesseract を使ってローカル環境で実験中です。

今のところ、精度はまずまず……でもまだまだ改善の余地アリ! 特に、「ひらがなをしっかり読み取れるようにする」 という目標に向けて試行錯誤中。

🔍 今回のポイント

  • ローカル環境でPythonを実行中!
  • Tesseractを使ったOCRに挑戦。
  • 罫線除去、膨張処理を取り入れて精度アップを目指す。
  • 次はSYFontを追加してもっと精度を上げたい!

💡 SYFontとは?

SYFontとは、特に「ひらがな」の読み取り精度を向上させるために自作するフォントデータです。 Tesseractに追加することで、手書きのひらがな認識を強化できる予定。 現在はまだ作成中ですが、完成すれば精度が大幅に向上することを期待しています!

※前回、ShioruFontで作ろうとしてましたが、Shioru&YuraFont、略して「SYFont」です❣

💻 Pythonコード(実験中のバージョン)

Pythonコードはこんな感じ

🌸読み取りたい画像(ゆらがつくったひらがなのおはなし1ぺーじめをしおるが手書き)

📷 加工した画像

📝 現在の読み取り結果

🚀 次の挑戦

今回のコードでもある程度のひらがなは読み取れてる!でもまだエラーが出ちゃうことも多い。 次のステップは 「SYFontを追加する」 こと!

SYFontを作ってTesseractに追加すれば、もっと精度が上がるはず! 次の実験もお楽しみに!🎉😊

🌸過去のPythonコードはこちらから!

コメント