vLLM: An Efficient Inference Engine for Large Language Models [pdf]

		vLLM: An Efficient Inference Engine for Large Language Models [pdf] (eecs.berkeley.edu)
		2 points by ankitg12 28 days ago \| hide \| past \| favorite