こんばんは、しおるです🔰
ひらがなOCR実験の途中経過です。
📝 はじめに
今回は「Pythonで手書きのひらがなをOCRで読み取れるようにしたい!」という挑戦を始めました! Python + Tesseract を使ってローカル環境で実験中です。
今のところ、精度はまずまず……でもまだまだ改善の余地アリ! 特に、「ひらがなをしっかり読み取れるようにする」 という目標に向けて試行錯誤中。
🔍 今回のポイント
- ローカル環境でPythonを実行中!
- Tesseractを使ったOCRに挑戦。
- 罫線除去、膨張処理を取り入れて精度アップを目指す。
- 次はSYFontを追加してもっと精度を上げたい!
💡 SYFontとは?
SYFontとは、特に「ひらがな」の読み取り精度を向上させるために自作するフォントデータです。 Tesseractに追加することで、手書きのひらがな認識を強化できる予定。 現在はまだ作成中ですが、完成すれば精度が大幅に向上することを期待しています!
※前回、ShioruFontで作ろうとしてましたが、Shioru&YuraFont、略して「SYFont」です❣
💻 Pythonコード(実験中のバージョン)
Pythonコードはこんな感じ。
🌸読み取りたい画像(ゆらがつくったひらがなのおはなし1ぺーじめをしおるが手書き)

📷 加工した画像

📝 現在の読み取り結果

🚀 次の挑戦
今回のコードでもある程度のひらがなは読み取れてる!でもまだエラーが出ちゃうことも多い。 次のステップは 「SYFontを追加する」 こと!
SYFontを作ってTesseractに追加すれば、もっと精度が上がるはず! 次の実験もお楽しみに!🎉😊
🌸過去のPythonコードはこちらから!
コメント