建立與使用Computer Vision(電腦視覺)服務

Computer Vision 是Azure Cognitive Services中,一組作影像識別辨識的API,功能強大,可以進行圖片內容(意義)的識別。也可以找出圖片中的人臉,並且判斷年紀、性別。還可以進行OCR,找出圖片中的文字…等,該服務的官方網站位於:
https://learn.microsoft.com/zh-TW/azure/cognitive-services/computer-vision/

申請使用金鑰

使用上很簡單,可透過SDK或Rest API來呼叫,由於我們要透過程式碼來呼叫使用該服務,因此得先從Azure平台上申請一組Key,並取得Rest API的Endpoint。

請參考影片中的操作:

上面的影片中,你看到我們申請好Computer Vision服務,並取得金鑰與端點的位置。

使用Rest API呼叫識別服務

取得金鑰與端點之後就好辦了,參考官方文件,你會明白如何呼叫,以及API的詳細使用說明。

簡單的說,我們可以把圖片上傳給剛才我們建立好的服務端點(endpoint),然後雲端AI服務就幫我們辨識出圖片的結果(以JSON回傳),而呼叫的時候,需要一個key,僅此而已。

我在上課時,會刻意帶學員從網上找到底下這分文件,並且整個看過一次:
https://westus.dev.cognitive.microsoft.com/docs/services/computer-vision-v3-2/operations/56f91f2e778daf14a499f21b

因為呼叫方式雖然常常快速迭代改版,但其實Azure Cognitive Services中幾乎每一個服務都有清晰的文件,只要能找到並看懂文件,抓到重點,呼叫上非常方便。

底下影片介紹你如何在文件中找到幾個關鍵,例如呼叫的參數、呼叫時的http method,以及上傳檔案給endpoint的方法:

看懂文件,你應該知道如何透過rest api呼叫該服務了(使用SDK的方式以後再談),接著,我們可以透過免費的postman工具,來嘗試呼叫該影像辨識服務。

postman是網路上免費可下載的 rest api呼叫測試工具,非常簡單好用。下載位置位於: https://www.postman.com/

取得postman之後,就可以透過該工具,來測試如何使用雲端服務做圖片辨識,操作的流程如下:

動作就只有這樣而已,非常簡單,然後,你就可以邁入AI應用程式開發的第一步了。(對於很多開發人員來說,有Rest API,就可以做任何事情了,不是嗎?)

留言

這個網誌中的熱門文章

使用LM Studio輕鬆在本地端以API呼叫大語言模型(LLM)

VS Code的字體大小

使用 Dify 建立企業請假機器人

使用 Dify API 快速建立一個包含前後文記憶的對談機器人

使用 Dify 串接 LINE Bot