V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
pureGirl
V2EX  ›  程序员

需要高并发读取 xlsx 文件存入数据库怎么处理比较好

  •  
  •   pureGirl · 3 天前 via iPhone · 2360 次点击
    用 django celery 可以实现吗
    24 条回复    2025-01-29 22:08:22 +08:00
    wen20
        1
    wen20  
       3 天前
    有多少 xlsx 要读, 还需要高并发
    pureGirl
        2
    pureGirl  
    OP
       3 天前
    @wen20 实际不需要多少,但是要处理并发
    neoblackcap
        3
    neoblackcap  
       3 天前
    不是很懂什么叫高并发读取 xlsx 文件,你一个文件需要很多个人一起读?还是一大批文件需要并行处理?
    只是简单的并行处理,直接进程池就可以解决问题了
    pureGirl
        4
    pureGirl  
    OP
       3 天前 via iPhone
    @neoblackcap 就是会并发上传 xlsx 文件,然后把内容写入数据库
    lxue
        5
    lxue  
       3 天前
    可以实现,celery 是异步的不会阻塞 Django 的 worker 的
    neoblackcap
        6
    neoblackcap  
       3 天前
    @pureGirl 并发上传文件,那先上传到对象存储,然后创建异步任务,慢慢处理
    pureGirl
        7
    pureGirl  
    OP
       3 天前 via iPhone
    @neoblackcap 现在就直接把文件转换成二进制存到队列里,然后 worker 一个个处理
    neoblackcap
        8
    neoblackcap  
       3 天前
    @pureGirl 那这个方案现在是有什么问题吗?数据不大的话,处理得快也不是不行
    alphaControler
        9
    alphaControler  
       3 天前 via Android
    并发要解决的是数据竞争问题,你这只是读的话,多少并发都没问题。如果是有写,那就看具体情况,要么按时间片分文件,要么读写锁。
    pureGirl
        10
    pureGirl  
    OP
       3 天前 via iPhone
    @neoblackcap 之后可能会有数据比较大的情况
    rogerer
        11
    rogerer  
       3 天前
    @pureGirl 那就做优先级队列?把耗时长的任务放后面一点,并行处理 xlsx 也没有太多特殊的操作。
    8355
        12
    8355  
       3 天前
    不是我说,高并发有 qps50 没。。。。
    thoo61871
        13
    thoo61871  
       3 天前
    异步
    随便你怎么实现都行
    neoblackcap
        14
    neoblackcap  
       3 天前
    @pureGirl 那就改成先上传到对象存储,然后你处理的时候再从对象存储读回。反正都落盘了,后续都是慢慢处理的问题的。
    sazima
        15
    sazima  
       3 天前
    很耗时吗? Dajngo 部署不是单进程的,不需要 celery
    neoblackcap
        16
    neoblackcap  
       3 天前
    @pureGirl 还有就是对象存储的读取,记得走 VPC/内网,既省钱,又提高性能
    pureGirl
        17
    pureGirl  
    OP
       3 天前 via iPhone
    @neoblackcap 我研究一下,谢谢
    opengps
        18
    opengps  
       3 天前   ❤️ 1
    单个文件的操作是独占的,并非高并发的概念。你可能高频,但不是并发
    pureGirl
        19
    pureGirl  
    OP
       3 天前 via iPhone
    @opengps 不是单个文件啊,是多次请求处理文件
    pureGirl
        20
    pureGirl  
    OP
       3 天前 via iPhone
    @opengps 高频是什么东西没听说过
    windyboy
        21
    windyboy  
       2 天前
    多个人不可能一起写一个文件
    ponyfk
        22
    ponyfk  
       2 天前
    --- 用 django celery 可以实现吗

    可以实现。以我的经验,celery 都不需要,就在 view 代码里面处理
    ShineyWang
        23
    ShineyWang  
       1 天前 via Android
    很多数据库应该直接支持 Excel 导入
    512357301
        24
    512357301  
       1 天前 via Android
    试试 duckdb
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1991 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 14:28 · PVG 22:28 · LAX 06:28 · JFK 09:28
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.