利用ollama 分析圖片

 本專案使用 ollama + python  + moeel llama3.2-vision:11b 
解析本圖片的內容


安裝 ollama :

curl -fsSL https://ollama.com/install.sh | sh

conda create --name ollama python=3.12

conda activate ollama

pip install ollama

測試ollama command mode :

 ollama run deepseek-r1:32b


程式碼 trans.py :


import base64
import requests
import ollama
import argparse

def convert_image_url_to_base64(url):
    response = requests.get(url)
    if response.status_code == 200:
        image_data = response.content
        base64_encoded = base64.b64encode(image_data).decode('utf-8')
        # return f"data:image/jpeg;base64,{base64_encoded}"
        return base64_encoded
    else:
        return None

def main():
    parser = argparse.ArgumentParser(description='Process an image URL.')
    parser.add_argument('-i', '--image_url', type=str, help='The URL of the image')
    args = parser.parse_args()
    if args.image_url:
        image_url = args.image_url
        base64_image = convert_image_url_to_base64(image_url)
        if base64_image:
            res = ollama.chat(
                model="llama3.2-vision:11b",
                messages=[
                    {
                        'role': 'user',
                        'content': '分析這張相片,並用中文說明,另外給五個標籤及分析其中主要內容物,圖片內的文字一併寫出來:',
                        'images': [base64_image]
                    }
                ]
            )
            print(res['message']['content'])
        else:
            print("无法获取图像数据进行分析")
    else:
        print("没有提供图片 URL")

if __name__ == "__main__":
    main()


ps : 將遠端圖片轉成轉成base64 後輸入

執行 python llama.py -i https://cdn2.ettoday.net/images/8214/d8214742.jpg








留言