【Lesson 7】ひらがなOCR実験中！📷【Python】

Python

ColabではじめるPython入門｜ちびキャラゆらと学ぶ、やさしくて楽しいプログラミングの第一歩。

2025.04.03

こんばんは、しおるです🔰

ひらがなOCR実験の途中経過です。

📝 はじめに

今回は「Pythonで手書きのひらがなをOCRで読み取れるようにしたい！」という挑戦を始めました！ Python + Tesseract を使ってローカル環境で実験中です。

今のところ、精度はまずまず……でもまだまだ改善の余地アリ！特に、「ひらがなをしっかり読み取れるようにする」 という目標に向けて試行錯誤中。

SYFontとは、特に「ひらがな」の読み取り精度を向上させるために自作するフォントデータです。 Tesseractに追加することで、手書きのひらがな認識を強化できる予定。現在はまだ作成中ですが、完成すれば精度が大幅に向上することを期待しています！

※前回、ShioruFontで作ろうとしてましたが、Shioru＆YuraFont、略して「SYFont」です❣

Pythonコードはこんな感じ。

🌸読み取りたい画像（ゆらがつくったひらがなのおはなし１ぺーじめをしおるが手書き）

📷 加工した画像

📝 現在の読み取り結果

今回のコードでもある程度のひらがなは読み取れてる！でもまだエラーが出ちゃうことも多い。次のステップは 「SYFontを追加する」 こと！

SYFontを作ってTesseractに追加すれば、もっと精度が上がるはず！次の実験もお楽しみに！🎉😊

🌸過去のPythonコードはこちらから！