大語言模型仍無法可靠區分信念與事實