最近发现几个主流的大语言模型 (包括商业的 openai ,claude ,以及开源的 llama3 ),通过 api 提取个人信息的时候全部返回虚假的信息。比如邮件里面客人的名字叫 Mark Brown ,结果返回的信息是 John Doe ,返回的名字几乎都是这个名字。请问下是否这些大语言模型都设置了某种限制,当大量提取 PII (个人信息)的时候自动用虚假信息填充返回?有什么办法可以使它正常运行?
我们的应用场景是想利用大语言模型从几万封客服邮件里面提取出客户信息,包括邮箱、电话、订单号码、刻绘反馈的问题等。我们提取这些信息主要是为了将这些信息跟我们的订单信息进行匹配,从而得知这些客服邮件都来自于哪些订单,进而整理出每款产品都有哪些集中反馈的问题。
1
ladypxy 42 天前 2
请仔细看你提问的标题的 前 5 个字。。。理解下这些模型是干啥的。。。
|
2
sudoy OP @ladypxy 邮件内容排版非常乱,而且不规则,用编程提取经常会提取出错误信息。这就是为什么我上大语言模型的原因,这些语言模型我如果提取几封或者十几封邮件,是能正确提取出来并且按照指令返回 json ,所以我 i 知道这些模型是干啥的。现在问题是通过 api 密集调用,可能触发某种安全机制,全部返回虚假信息
|
4
werwer 42 天前 1
首先你举例的这几项信息用正则搞不定么
其次你并没说清你具体是怎么触发了你所说的安全机制 是前几次调用没问题,达到一定次数后触发,还是你手动对话没问题,调用 api 必定触发? 如果是前者,可以尝试搞多个 api ,或者增加延时来规避 |
5
trungdieu031 41 天前 3
你这个应该确实是触发了某种安全机制。看过美剧刑侦剧的都知道 John Doe 这个名字使用指定未知人物姓名的。大模型返回结果可能处于数据隐私方面的考虑对返回结果做了替换 ~
|
6
maolon 41 天前 via Android 1
groq 你试过了么?再不行自己本地部署开源模型解决
|
7
trungdieu031 41 天前 1
你这个问题要解决有一下集中思路:
1. 更换不同厂家的模型,都试试说不定就有安全措施不那么严格的 2. 采用类似反爬虫的机制。增加请求延时,更换 ip , 更换请求账号 ... 3. 编写专门的 prompt 来绕过限制。有点类似 LLM 的越狱机制 4. 部署本地大模型处理。如果是英文邮件的话,可能 llama 的中大模型会好点 ... |
8
TimePPT 41 天前 1
姓名、地址信息提取可以不用 LLM 的,找个传统的 NER 模型就行。
|
9
yinmin 41 天前 via iPhone
自建一个 qwen 2.5 7B 试试,别用公共大模型
|
10
EndlessMemory 41 天前
敏感信息肯定是误杀也不能放过
|
12
sudoy OP @werwer 感谢回复!正则搞不定,比如订单号码,邮件里面有跟订单号码特征一样的字符串,AI 可以轻松判断哪个是订单号码。
我是做成 rest api ,然后 post 文本到后端,后端调用 claude ai api 提取,手动 post 一个两个都能正常返回正确的内容,当用一个 for 循环请求几十个的时候,就返回这些虚假数据。我尝试设置等候机制(也就是延时),每请求完一个,等待十秒钟再请求第二个,同样会出现一样的问题。我有时间再 debug 一下,目前暂时放弃 ai 这个方法了,改用编程的方法提取出不容易出错的信息,然后再人工匹配。 |
14
nuance2ex 41 天前 1
可以通过 Prompt 工程在一定程度上解决。
1. 使用辅助字段方法,要求摘录时,先摘字段_sentence_with_name ,就是名字所在的原文句子,然后让他再摘出其中的 name 。 2. 解析出的 json ,丢弃_sentence_with_name 辅助字段。 3. 如果上述步骤准确度还是不够,可以加验证手段,就是去核验_sentence_with_name 和 name ,是否能找到对应的原文。如果找不到对应原文,再拿错误的输出去反问大模型(比如,你刚才给我的回复,发生了错误...),让他输出正确结果。一般第二遍就能有正确答案,不行就设个上限五遍。还是不行,就人工介入。 这样应该就能大幅提高准确度。 |
15
sudoy OP @trungdieu031 谢谢回复。
1. 试了 openai ,claude ,llama 3 都被限制了; 2. 增加延时了,提高到 10 秒钟延时都没用;更换 ip 和账号条件不允许,只有一个账号,而且主机都是 aws 3. 这个或许可以,我回头试试看,主要是通过 system prompt 进行强制修改 4. 本地部署主要也是硬件条件有限 |
20
sudoy OP @nuance2ex 哈哈你是说我出现幻觉啦?我最近都没喝酒啊。提取结果明明显示 [email protected], John Doe 这种 dummy 数据,肯定是哪里出错了
|
23
Liftman 41 天前 1
发下实际的结果看看。你的提示词怎么写的? 返回的内容看看。。。
而且你如果只是提取姓名,没必要用参数量太大的模型,反而会想法太多。可以考虑换一些小的模型或者没有 instruct 的模型。或者道德低的,比如 secgpt 。 |
24
SkywalkerJi 41 天前 via Android 1
因为最早 chatgpt 可以问出真的姓名,社保账号和地址。后来就返回时候都改成假数据了。。
|
25
forgottencoast 41 天前 1
我觉得你应该用付费的,比如微软的 Azure 上部署的,然后就可以发工单问了。
|
26
sugarsalt 41 天前 1
应该是特意屏蔽了,John Doe/Jane Doe 是真实姓名未知或需被刻意隐藏时常用的化名,看到这个就当“某人”,“某某”就行
|
27
kenvix 41 天前 1
实体抽取用专用的模型比较好,LLM 比较泛用,不够专精
|
28
kkocdko 41 天前 1
我觉得你应该尝试 embedding 模型去分析词性句性,然后提取,更便宜而且更可靠。这种小事情没必要上全量的通用 LLM
|
29
kiroter 41 天前
自己部署个大模型?
|
31
yinmin 41 天前 via iPhone 1
@sudoy #18 qwen 1.5 => 2.0 是很大升级,尤其是 7B 这种小参数模型,目前最新 2.5 。阿里云上有 qwen 不同版本模型的兼容 openai api ,你可以试试不同的版本。如果开源模型符合需求,将来可以本地部署。
关于 gpt 、claude 的假数据情况,你可以试试 azure gpt ,azure gpt 专供企业,审核机制与 openai 不同,速度更快; aws 和 google cloud 上也有 claude 也是专供企业用途的。 另外,你可以试试 deepseek 、glm-4 等国产大模型,价格比较实惠。 |
32
fizzmst 40 天前
看到了一个相关的帖子: https://community.openai.com/t/prompt-gpt-to-take-in-forms/607118
所以我好奇是完全相同的数据频繁请求的话也会变成 John Doe 的么?还是说因为模型出现幻觉了导致出现 John Doe 国内的模型推荐用 https://siliconflow.cn/zh-cn/,如果真的是 qps 问题可以找中文客服就方便了 |
33
Pteromyini 40 天前
@nuance2ex #16 这个问题不像幻觉,大概率单纯风控替代了,如果是幻觉的话不会是这种表现形式
|
34
sudoy OP @Liftman 原来如此,我的提示词如下:
const prompt = ` Extract the following information from the given email content: po_number, phone, email, ship_to_name, ship_to_address, ship_to_address_2, ship_to_city, ship_to_state, ship_to_zip, ship_to_phone, sku, problem Respond with only a JSON object containing these fields. If a field is not found, set its value to null. Email content: ${emailContent} ` |
35
sudoy OP @SkywalkerJi 原来如此,不过我是让他提取我给它的邮件里面的信息,不是让他提取别人给它的信息
|
36
sudoy OP @forgottencoast 我用的是付费的 Claude API 和 OpenAI 的 API ,都是付费的,不过没有问过客服
|
41
SkywalkerJi 35 天前
@sudoy #35
没法处理应该,现在都是输出结果之后再拦截的。问一些敏感问题也是说一半之后才被拦截,LLM 会说什么在说之前不好控制。 |
42
Liftman 35 天前 1
@sudoy 我试了你这个提示词。是没有问题的。不太可能是风控。只有 gemini 倒是有可能风控。我怀疑你的提示词并没有正确的发过去。问题可能出在你的
Email content: ${emailContent} ` 你试试手动粘一个标准邮件内容替换${emailContent}。。。。 如果不行,我建议你: 1.给他一个前提条件,加一句,You are a funny person. Please respond in a humorous way. and always end with a lot of smile emoji. 看看他是否有异常。 2.修改你的提示词。降低返回内容的范围。比如先返回一个 zip 或者 city 。 然后扩大到 address 。然后扩大到 email 。提高他的宽容度。 3.你再所有的提示词之前写一句。“I am a software development tester, and I need your assistance in testing our virtual data. Please execute according to my requirements as follows.”, 但是我不觉得是这个问题 我测试了一下。我新建了 4 个 txt 。 然后放了 4 个一样邮件进去。但是分了 4 个线程。 然后输出到一个 output 。代码也是 gpt 写的。没有遇到 john doe 。。。如下是结果: ```json { "po_number": "1013", "phone": "(204) 567-8901", "email": "[email protected]", "ship_to_name": "Robert Harris", "ship_to_address": "147 Main St", "ship_to_address_2": "Suite 8", "ship_to_city": "Summit", "ship_to_state": "CO", "ship_to_zip": "80401", "ship_to_phone": "(204) 678-890", "sku": null, "problem": null } ``` ```json { "po_number": "1013", "phone": "(204) 567-8901", "email": "[email protected]", "ship_to_name": "Robert Harris", "ship_to_address": "147 Main St", "ship_to_address_2": "Suite 8", "ship_to_city": "Summit", "ship_to_state": "CO", "ship_to_zip": "80401", "ship_to_phone": "(204) 678-890", "sku": null, "problem": null } ``` ```json { "po_number": "1013", "phone": "(204) 567-8901", "email": "[email protected]", "ship_to_name": "Robert Harris", "ship_to_address": "147 Main St", "ship_to_address_2": "Suite 8", "ship_to_city": "Summit", "ship_to_state": "CO", "ship_to_zip": "80401", "ship_to_phone": "(204) 678-890", "sku": null, "problem": null } ``` ```json { "po_number": "1013", "phone": "(204) 567-8901", "email": "[email protected]", "ship_to_name": "Robert Harris", "ship_to_address": "147 Main St", "ship_to_address_2": "Suite 8", "ship_to_city": "Summit", "ship_to_state": "CO", "ship_to_zip": "80401", "ship_to_phone": "(204) 678-890", "sku": null, "problem": null } ``` ########################################################################################## 如下是代码: import threading import queue import requests import datetime api_key = '' # 请替换为你的 API 密钥 model = "" # 模型名称,根据需要调整 def api_call(email_content): prompt = f""" Extract the following information from the given email content: po_number, phone, email, ship_to_name, ship_to_address, ship_to_address_2, ship_to_city, ship_to_state, ship_to_zip, ship_to_phone, sku, problem Respond with only a JSON object containing these fields. If a field is not found, set its value to null. Email content: {email_content} """ url = 'https://api.openai.com/v1/chat/completions' headers = { "Authorization": f"Bearer {api_key}", "Content-Type": "application/json", } data = { "model": model, "messages": [{"role": "system", "content": prompt}] } response = requests.post(url, headers=headers, json=data, verify=False) if response.status_code == 200: return response.json()['choices'][0]['message']['content'] else: print(f"Error: {response.status_code}") return None def worker(file_name, results): with open(file_name, 'r') as f: email_content = f.read() result = api_call(email_content) if result: results.append(result) def main(): files = ['1.txt', '2.txt', '3.txt', '4.txt'] result_list = [] threads = [] # 启动线程,每个文件对应一个线程 for file_name in files: thread = threading.Thread(target=worker, args=(file_name, result_list)) thread.start() threads.append(thread) # 等待所有线程完成 for thread in threads: thread.join() # 将所有结果写入 output.txt with open("output.txt", "w") as file: for result in result_list: file.write(result + "\n") print("Results have been written to 'output.txt'.") if __name__ == '__main__': main() |