Feedback

C# - OCR / Google´s Tesseract / Captcha cracking u.v.m.

Veröffentlicht von am 31.03.2017
(1 Bewertungen)
OCR - Optical Character Recognition

Mit diesem Snippet könnt ihr einfache Captcha Bilder lösen. Und nicht nur das, bei Filter könnt ihr z.B. noch Zahlen hinzufügen wenn ihr versuchen wollt Auto Kennzeichen aus Bildern zu lesen oder was auch immer ...

Die Sprache lässt sich auch einstellen, aber wie Tesseract an sich funktioniert könnt ihr ja googeln ;-)

Usings:
- using Tesseract;
- using System.Drawing;

Ich verwende:
- Tesseract 3.04
https://github.com/charlesw/tesseract

Benötigt:
- Visual C++ Redistributable für Visual Studio 2015
https://www.microsoft.com/de-DE/download/details.aspx?id=48145
GFU-Schulungen  [Anzeige]

Visual Studio Team Foundation Server 2017/2015 (TFS) für Projektmitglieder - Kompakt

Nach Teilnahme an dieser Schulung sind Ihnen die Grundlagen von ALM geläufig. Sie planen und steuern Projekte effizient mit dem Visual Studio Team Foundation Server.

VB.NET 2017/2015/2013 Komplett

Ziel des Seminars ist der flexible Umgang mit VB.NET, wie z.B. die damit verbundene eigenständige Entwicklung von Programmen oder das Verwenden von Datenbanken.

        /// <summary>
        /// Bildtext lesen / Read Image Text
        /// </summary>
        /// <param name="ImgPath"></param>
        /// <returns>Bildtext / Image Text</returns>
        string OcrDoYourThing(Bitmap ImgPath)
        {
            var imgsource = new Bitmap(ImgPath);
            var tessdata = Application.StartupPath + "\\tessdata";
            var filter = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ";

            var ocrtext = string.Empty;
            using (var engine = new TesseractEngine(tessdata, "deu", EngineMode.Default))
            {
                engine.SetVariable("tessedit_char_whitelist", filter);
                using (var img = PixConverter.ToPix(imgsource))
                {
                    using (var page = engine.Process(img))
                    {
                        ocrtext = page.GetText();
                    }
                }
            }
            return ocrtext;
        }

Kommentare zum Snippet

 

Logge dich ein, um hier zu kommentieren!

Ähnliche Snippets