Triton_Inference_Server_Streaming_Demo

Streaming文件夹为下图Triton Inference Server中红色模块示例代码，未经测试，只是显示一下推流在triton部署中的逻辑。对于triton部署的推流模块，不要放在main.py的sub_module中，因为会导致主线程阻塞，无法完成后续推理任务。相应的，应该放在类似ensemble model中，因为ensemble可以异步调用，每个模块可以独立工作节约资源。运行结果应该发送至流媒体服务器以释放triton资源，否则会造成推理服务器的显存浪费。

本人是ffmpeg小白，从来没使用过，相关推流代码可能无法运行，本样例仅显示triton业务逻辑，见谅！欢迎大佬帮忙修正代码。

测试用轻量化hls推流方案，免流媒体服务器安装

与triton的配合见下图

代码在m3u8looper目录下，来自开源项目：https://github.com/eventh/m3u8looper

音视频同步

音视频同步代码可以使用torchvision单行代码实现:

torchvision.io.video.write_video(
        filename=r"test.ts",
        # video_array=torch.zeros(size=(ts_length*FPS,256,256,3)),
        video_array=torch.tensor(imgs),
        fps=FPS,
        video_codec = "libx264",
        # audio_array=torch.zeros(size=ts_length*HZ)* 32767).reshape(1,-1),
        audio_array=torch.tensor(wav[:160000]* 32767).reshape(1,-1),
        audio_fps = HZ,
        audio_codec = 'mp2',
    )

注意该方法使用了较早版本的pyav（有些方法已经弃用），如果是新版本pyav，需要做适当修改。支持的音视频编码格式也不是太多, ts切片经测试可以正常播放。

AI796/Triton_Inference_Server_Streaming_Demo

Triton_Inference_Server_Streaming_Demo

测试用轻量化hls推流方案，免流媒体服务器安装

音视频同步