简体中文 | English

glm-edge视觉多模态示例

这是如何使用 OpenVINO 部署glm-edge-v视觉多模态的示例

1. 转换模型

由于需要将Huggingface模型转换为OpenVINO IR模型，因此您需要下载模型并转换。

python3 convert.py --model_id ZhipuAI/glm-edge-v-2b --output {your_path}/glm-edge-v-2b-ov --modelscope

可以选择的参数

--model_id - 用于从 Huggngface_hub (https://huggingface.co/models) 或模型所在目录的路径（绝对路径）。
--output - 转换后模型保存的地址。
--modelscope - 通过魔搭社区下载模型。

2. 运行流式问答

python3 qa.py --model_path {your_path}/glm-edge-v-2b-ov --query "请描述这张图片" --image_path {your_path}/your_test_image.jpg --max_sequence_length 4096 --device CPU

可以选择的参数

--model_path - OpenVINO IR 模型所在目录的路径。
--query - 用户问题。
--max_sequence_length - 输出标记的最大大小。
--image - 输入图片路径。
--device - 运行推理的设备。例如："CPU","GPU"。

输出示例

图片中是一辆白色的皮卡车。具体地，这辆皮卡车的外观颜色为白色，带有黑色的轮胎。车的设计看起来实用，适合用于携带货物和工具。皮卡车的挡风玻璃是透明的，可以清晰地看到车内。车窗玻璃为蓝色，车门把手是黑色的。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README_zh.md

README_zh.md

glm-edge视觉多模态示例

1. 转换模型

可以选择的参数

2. 运行流式问答

可以选择的参数

输出示例

Files

README_zh.md

Latest commit

History

README_zh.md

File metadata and controls

glm-edge视觉多模态示例

1. 转换模型

可以选择的参数

2. 运行流式问答

可以选择的参数

输出示例