利用ollama 分析圖片
![]() |
解析本圖片的內容 |
安裝 ollama :
curl -fsSL https://ollama.com/install.sh | sh
conda create --name ollama python=3.12
conda activate ollama
pip install ollama
測試ollama command mode :
ollama run deepseek-r1:32b
程式碼 trans.py :
import base64
import requests
import ollama
import argparse
def convert_image_url_to_base64(url):
response = requests.get(url)
if response.status_code == 200:
image_data = response.content
base64_encoded = base64.b64encode(image_data).decode('utf-8')
# return f"data:image/jpeg;base64,{base64_encoded}"
return base64_encoded
else:
return None
def main():
parser = argparse.ArgumentParser(description='Process an image URL.')
parser.add_argument('-i', '--image_url', type=str, help='The URL of the image')
args = parser.parse_args()
if args.image_url:
image_url = args.image_url
base64_image = convert_image_url_to_base64(image_url)
if base64_image:
res = ollama.chat(
model="llama3.2-vision:11b",
messages=[
{
'role': 'user',
'content': '分析這張相片,並用中文說明,另外給五個標籤及分析其中主要內容物,圖片內的文字一併寫出來:',
'images': [base64_image]
}
]
)
print(res['message']['content'])
else:
print("无法获取图像数据进行分析")
else:
print("没有提供图片 URL")
if __name__ == "__main__":
main()
ps : 將遠端圖片轉成轉成base64 後輸入
執行 python llama.py -i https://cdn2.ettoday.net/images/8214/d8214742.jpg
留言
張貼留言