ld_openelm.c 1.支持batch 2.q8量化 3.avx2和avx512加速 4.python wrapper 5.零依赖 6.单文件完成推理 7.cpu版本,开启-O3优化的情况下加速1.5倍 8.cpu版本,q8量化,开启-O3优化的情况下加速3倍 9.混合精度