使用Computer Vision中的OCR文字辨識功能

作者： DD - 2月 21, 2023

OCR(Optical Character Recognition)指的是識別圖片中的文字，如果你先前已經成功使用Computer Vision API做影像識別(Image Analysis)，那使用Computer Vision API做OCR肯定也難不倒你。

你會發現，ORC的API與先前我們介紹過的影像分析幾乎一模一樣，唯一差別是要給定的endpoint URL，最後的結尾是『ocr』。設定如下:

另外，如果要辨識中文，建議要給定language這個queryString參數，值為『zh-Hant』。

有這些資訊就夠了，我們一樣透過postman來測試，關鍵的資訊如下:

關鍵資訊	值
endpoint	https://你的endpoint.cognitiveservices.azure.com/vision/v3.2/ocr?language=zh-Hant
Ocp-Apim-Subscription-Key(http Header)	你的key
Http body	{“url”:“要辨識的圖片url”}

透過這些，我們就可以嘗試辨識了。透過Rest API將要辨識的有像位置(url)傳遞過去，辨識的結果會以JSON回傳。

操作影片如下:

影片中，辨識的文件是底下這張圖:

你也可以自行試試看，你會發現，中文的辨識度其實非常高，幾乎正確的辨識出每一組文字。

回傳的物件是JSON格式，由於圖片上的文字可能有橫有直，辨識出的結果會是以 Regions, Lines, Words, Text 為結構回傳:

透過 computer Vision 中的 ocr API，取得圖片上的文字變得非常輕鬆。

.NET Walker