杨院长生日,收到了一条”奇怪”的祝福短信:客户关系维护的长期主义与”非销售”艺术

杨院长生日那天,早上八点,手机响了。

一条短信:

> “杨院长您好,我是昆明软佳的小张。您最近在忙关于HIS系统二期的事情吗?听说你们想加一个慢病管理模块,我们最近做了两家医院的方案,如果需要参考,我可以发给您。——小张,138xxxx”

杨院长愣住了。

她确实在考虑HIS系统二期,要加慢病管理,但还没跟任何人说。连信息科李主任都不知道。

这个”小张”怎么知道的?

她回复:”谢谢,你怎么知道我考虑这个?”

小张秒回:”上次您开会时说’要关注慢病患者管理’,我记下了。刚好我们公司最近在做这方面的产品,就跟您分享一下。”

杨院长心里一暖。

这是个用心的销售。

但更让她感慨的是:这是她收到的唯一一条”生日祝福”,不是群发的,是有实质内容的

1. “客户关系”不是”节日群发”:小张做对了什么?

杨院长把这事跟李主任说了,顺便问:”你们信息科跟软佳谁对接?”

“小张,客户成功经理。”

“他怎么样?”

李主任苦笑:”这就是小张啊。软佳的客户经理,跟华通的赵某完全是两种人。”

赵某是华通的销售,逢年过节群发祝福短信,内容都是”尊敬的X总,值此佳节…”,连名字都不带换的,杨院长收到过好几次,直接删。

但小张不一样。

“你知道他做了什么吗?”李主任问。

杨院长摇头。

“去年冬天,我们儿科有个新生儿严重黄疸,需要转上级医院。但转院要HIS系统出转诊单,那功能我们没有买。小张知道后,连夜联系他们公司,免费给我们开了个临时授权,让我们用了一个月。”

“这种事,他们收费吗?”

“不收。他说’病人要紧’。”

“然后呢?”

“然后我们就买了那个模块。但不是因为他’献殷勤’,是因为他真的理解我们的需求。”

2. “销售”和”客户成功经理”,有什么区别?

小张的身份,从销售,变成了”客户成功经理”。

这是软佳两年前做的组织变革。

以前,销售签完合同就交给实施团队,自己再去追新客户。实施团队交付完,交给运维,自己再去实施下一个项目。运维解决报障,但不会主动联系客户。

客户在软佳的体验,是(“断点式服务”)——每个环节都有人,但环节之间有 gap。

变革后,每个客户,从销售开始,就有一个(“成功经理”)全程跟进。

小张就是XX医院的成功经理。

他的职责不是”卖更多产品”,而是”让客户成功”。

具体做:

每月至少一次上门拜访,不聊销售,只了解需求

每季度提供一份”系统健康报告”(性能、故障、使用率)

每半年做一次”需求工作坊”,帮客户梳理下一步要做什么

客户遇到任何问题,第一个联系他,他协调公司内部资源

“这不就是售后吗?”杨院长问。

李主任:”售后是被动响应,客户有问题才找你。成功经理是主动服务。他会提前发现客户可能遇到的问题。”

比如,小张最近发现XX医院的”医患沟通记录”功能使用率很低——这个功能是医生和患者在线沟通的,但医生不爱用。

小张没直接问”为什么不用”,而是去门诊待了一上午,看医生怎么和病人交流。

他发现:

– 医生在诊室,电脑上一边开医嘱一边跟病人说话,没空打字

– 而且有些患者是老人,不会用手机看消息

小张回去后,没跟客户说”你们得用这个功能”,而是提了个建议:把”医患沟通”和”语音病历”集成,医生说话,自动转文字发给患者

医院采纳了,这个功能的使用率从5%飙升到70%。

这就是(“卖解决方案,不是卖功能”)

3. “客户成功”怎么衡量?KPI决定行为

软佳给成功经理定的KPI,很奇怪:

客户健康度评分(系统可用率、故障次数、用户满意度调研)

客户续约率(不是”销售额”)

客户增购率(在原有合同基础上,买更多模块)

NPS(净推荐值)——客户是否愿意推荐给别人

小张的KPI里没有”本月签单金额”。

但奇怪的是,有了这个岗位,公司的:

– 续约率从70%提升到95%

– 增购率从20%提升到40%

– 客户流失率从15%降到5%

“因为客户感受到,你是真为他好。”杨院长说。

“赵某就 never 这样。”李主任说。

赵某也有KPI——”本月销售额”。所以他见客户,三句话不离”买这个模块””那个功能要不要””我们新产品很好”。

客户觉得他是来收割的,不是来帮忙的。

小张相反。他上门,first 问的是”最近有什么问题””什么功能不好用””你们明年准备做什么”。

问得多,说得少。

但问多了,他就知道客户真正要什么。

4. 生日短信的背后:长期主义的胜利

那天晚上,杨院长把小张发来的”慢病管理方案”研究了一下。

确实,做得很用心。方案里不仅有产品功能,还有:

– 三家已上线医院的运营数据(脱敏的)

– 患者满意度

– 医护人员使用率

– 投资回报率分析

这说明小张是真的调研过,不是随便发个模板来应付。

杨院长回复:”方案收到,很有参考价值。我们下周三开班子会讨论这个事,如果你方便,可以来参加,做个简短汇报。”

小张回复:”谢谢杨院长!我一定到,但不会推销产品,只分享案例。”

杨院长笑了。

她知道,下周三如果小张做得让她满意,二期项目很可能还是软佳的。即使不是全给他们,至少分一块蛋糕。

而这一切,都源于那条生日短信。

(杨院长不知道的是,那条短信,是小张花了两个小时写的——他查了杨院长半年的公开活动,发现她在一个学术会议上提到”慢病管理”,才有的放矢。)

5. 客户关系,不是”搞定一个人”,而是”搞定一个组织”

但小张也有失败的时候。

有一次,他极力推荐一个”智能分诊”模块,说能极大提升门诊效率——AI分诊,患者手机填写症状,系统推荐科室。

但信息科李主任试用了,说:”这玩意儿不实用。它让患者自己在手机上选症状,但很多患者描述不清楚,选错了,反而增加医生工作量。”

小张没坚持,回去跟公司说:”这个产品不适合XX医院,我们先不推。”

“那不等于放弃这个客户了吗?”同事问。

“不是,是更信任我们了。”小张说,”如果我们强推一个不适合的东西,客户会怀疑我们之前推的东西,是不是也不适合。”

这就是(“有时不卖,才是最好的卖”)

杨院长后来才知道这事。

“小张这个人,能处。”她说。

6. “关系”的三个层次:从交易到伙伴

李主任把软佳的客户关系维护,总结为三个层次:

第一层:交易关系

– 你给我钱,我给产品

– 履约即结束

– 容易替代(谁便宜选谁)

第二层:服务关系

– 有问题,响应快

– 有需求,能满足

– 有感情,但不多

– 不太容易被替代

第三层:伙伴关系

– 主动发现客户问题

– 帮客户规划未来

– 为客户的失败感到难过,为客户的 success 感到高兴

– 很难被替代——因为客户觉得你”懂”他

软佳在向第三层努力。

而华通,还在第一层——赵某每次来,就是”我们有个新功能,您要不要看看?”

7. 一个细节,让关系升华:搬家前的”免费检查”

去年冬天,XX医院搬新院区。

搬家前一天,小张带着两个工程师, arrive 医院, free 帮他们检查新院区的网络、机房、AP信号。

“这不是你们的事吧?”李主任问。

“是也不是。”小张说,”如果你们新院区网络有问题,我们的系统用着也不顺。帮你们,也是帮我们自己。”

他们忙到晚上十点,发现一个机房的网线标签贴错了(核心交换机和汇聚交换机接反了),及时纠正。如果搬家后才发现问题,得折腾三四天。

杨院长听说后,送来一箱水果:”你们真是…”

“应该的。”小张说。

杨院长 later 说:”搬家那次,让我 seeing 了什么是’靠谱’——不是签了合同才负责,是客户的事都是事。”

8. 关系的本质:把客户当成”活生生的人”

小张后来在一次内部培训上说:

“很多人觉得’客户关系’就是送礼、请吃饭、逢年过节送月饼。”

“但真正的客户关系,是(‘把客户当成活生生的人’)。”

他有KPI要完成,有领导要汇报,有病人要看,有投诉要处理。

你帮他把事做成,就是最好的关系。

你送他茅台,但他的系统三天两头崩,他 pressure 很大,他烦死了,他哪有心思喝茅台?

相反,你帮他解决一个问题,他记一辈子。

有时候,一句话的力量,胜过一万块礼品。

比如,客户生日,你送个蛋糕,不如发条短信说’记得您曾经提过X事,我帮您留意了,有进展’。

客户会觉得:你把我当人,你记得我说过的话。

这比什么都贵。

9. “客户成功经理”的制度设计:释放一线人员的善意

软佳的客户成功经理制度,有几个关键点:

① 独立性

– 成功经理不属于销售部门,也不属于实施部门

– 直接向”客户成功委员会”汇报(跨部门)

– KPI不与销售额挂钩

② 授权

– 可以调动公司内部资源(技术、产品、实施)

– 可以批准小额”免费服务”(如临时授权、紧急支持)

– 可以直接向高层反馈客户问题

③ 考核

– 客户NPS(占40%)

– 续约率(占30%)

– 健康度评分(占20%)

– 内部协作评分(占10%)

④ 客户数量

– 每个成功经理负责不超过15个客户

– 保证每月至少有一次面对面沟通

10. 长期主义的胜利:信任是最深的护城河

周总后来在一次内部会说:

“客户关系,是慢慢养出来的。”

不要指望签单时就亲如兄弟,而是:

– 第一次故障时,你响应快

– 第一次需求变更时,你理解

– 第一次升级时,你稳定

– 第一次续约时,你主动

每一次互动,都是一次”存款”或”取款”。

存多了,关系就稳了。

取多了,关系就崩了。

软佳的”客户关系账户”,一直在存钱。

华通的”客户关系账户”,一直在取钱(卖新功能、加价、推卸责任)。

所以,华通的客户,稍微有点风吹草动(谣言),就动摇。

而软佳的客户,即使有谣言,也不信——因为他们的”信任余额”够厚。

互动话题

你有过最感动的一次客户服务/售后服务经历吗?是什么让你觉得”值了”?

> 基于真实医院场景改编,人物均为化名


立即免费试用门诊系统https://app.kmhis.com/
International Versionhttps://app.kmhis.com/multi/
了解软佳门诊管理系统详情https://www.kmhis.com/outpatient-management-system.html


扫码预约

手机扫码试用患者预约。请勿输入个人真实信息(点击图片可查看原图)

支持8种语言:简体中文、繁体中文、香港中文、English、藏文、泰文、老挝语、越南语


说真的。这类问题我见过太多了。每次看到医院同事为选型头疼。我就想,要是早点有人把这些经验分享出来就好了。毕竟。选择不对。后面全是麻烦。选择对了。省心省力。还能提升整个机构的运行效率。希望这篇能帮到正在纠结的你。

你如果有具体需求。也可以去 www.kmhis.com 看看。那里有更详细的技术方案和案例。

距离开业只剩60天:一场与时间赛跑的系统上线

“林院长,营业执照拿到了,但系统还没着落。距离开业只剩60天,我们得抓紧了,否则要赔房东违约金。”

广东深圳南山区科技园,XX国际门诊部的筹备办公室是一间 borrowed 的共享办公空间。合伙人林院长站在白板前,用红色马克笔在日历上画了个大叉——今天是4月25日,开业计划定在6月24日,整整60天。

窗外深圳湾的风景很美,但林院长没心情欣赏。她今年38岁,是三甲医院的 former 儿科副主任,和四位同事一起集资800万开这家中高端外资诊所,主打跨境医疗服务。选址南山,目标客户是外籍人士、海归、高端本地家庭。

但有一个致命问题悬而未决:信息系统还没有

按照原计划,60天内必须完成:选型、签约、实施、培训、试运行。系统一旦延期,整个开业计划都要泡汤,房东租金照收,前期投入打水漂。

她面前放着5家厂商的方案:

某国产大厂:功能全,但实施周期6个月起,”我们的标准流程”

某进口系统:价格贵(年费5万+),实施要3-4个月,排期已到9月

某SaaS诊所软件:轻量,但功能不全,没有英文支持

软佳门诊管理系统:标准部署2-3周,可加速,支持8种语言

“2-3周?”林院长在电话里直接质疑,”你们是不是在吹牛?我们这诊所虽小,但五脏俱全,内外儿护检验药房,都要用。2周就上线?我不信。”

软佳销售小陈在电话那头淡定地说:”林院长,我们24年专做门诊系统,标准流程成熟。您这是全新开业,无历史数据迁移,6个科室规模适中,员工30人以下——这正是我们2-3周的标准案例。关键是——您能不能配合?每天至少有1-2人全身心投入准备。”

林院长心里快速盘算:大厂要6个月,直接pass;进口要3个月,太贵且慢,远超预算;轻量软件功能不够,外籍患者多,必须有多语言。只剩软佳,但”2-3周”听起来像奇迹,会不会牺牲质量?

她走到窗边,看着工地上忙碌的塔吊。作为医生,她知道”快”和”好”往往矛盾。但 reality 是:60天倒计时已经启动,没有第二个选项。

时间第一周:决策与签约

林院长带着小陈列出的”实施周期因素清单”做自我评估:

1. 数据质量:新机构,无历史数据,从零开始 → 有利

2. 科室数量:计划设内科、外科、儿科、检验、药房、收费共6个科室 → 标准范围

3. 培训范围:预计首批员工30人 → 2周内可完成

4. 并行策略:全新开业,无需并行,直接切换

“看来2-3周确实可能。”林院长心想。

但她还有顾虑:”软佳价格是1898元/年,比一些买断软件还便宜,靠谱吗?”

小陈解释:”我们是订阅制,价格透明。实施、培训、数据迁移都包含在内,没有隐形费用。您要做的就是配合准备。”

林院长又问:”和你们同期,其他机构也2-3周吗?”

小陈分享案例:深圳另一家外资诊所,2024年10月签约,11月上綫,从签约到上线共22天。

“如果您能保证每天有1-2人配合准备,60天绰绰有余,甚至可以在开业前5周完成。”

林院长心动了。但作为医疗行业老兵,她知道:凡事要留buffer

“这样,”她说,”我们签约,但要求4周内必须上线。如果延期,你们要负责。”

小陈agree:”我们签合同写清楚,延期有赔付。”

时间第二周:准备与账号开通

签约后第一天,软佳客服发来”实施准备清单”。林院长组织筹备团队开始准备:

– 确定科室:6个

– 医生名单:8人(3名全职,5名兼职)

– 护士/药房/收费:12人

– 药品/收费项目清单:整理出800+项(从采购计划中提取)

– 排班初稿:各医生出诊时间排好

林院长感慨:”还好我们有详细的筹备计划,数据都是现成的。如果是一家老机构要从旧系统迁移,这些真够折腾。”

小陈远程指导,确保清单无误后,开始账号开通和系统配置。

2天后,软佳寄来5台平板电脑(用于分诊和医生工作站),并远程连接到门诊局域网,进行初始化配置。

“你们不用服务器?”林院长问。

“软佳是SaaS,云端部署。您这里只需网络和终端设备。”小陈说。

林院长松了口气。她本来还担心要买服务器、装机房,现在省心了。

时间第三周:培训与数据录入

培训分三批进行:

第一批:管理层+系统管理员(5人),2小时。主要内容:后台管理、报表查看、参数配置。

“原来系统还能这样看数据!”林院长在培训后说,”实时门诊量、各科室效率、医生工作量,一目了然。”

第二批:医生组(8人),2小时。重点:电子病历模板、电子处方、检查申请、药品选择。

一位从三甲医院退休的王医生说:”这系统比我们大三甲的还好用,操作简单,模板也符合习惯。”

第三批:护士/药房/收费组(12人),各2小时。分诊、叫号、发药、收费流程。

最难教的是年长的护士,但经过半天练习,也都上手了。

小陈说:”软佳的设计原则是’3小时上手’。我们不怕您不懂,就怕您不练。”

时间第四周:测试与试运行

系统进入试运行阶段。筹备团队用3天时间,模拟了100+患者的完整流程:

– 预约(微信)

– 挂号分诊

– 医生接诊(开病历+处方+检查)

– 药房发药

– 收费结算

– 检查室接单

– 报告回传

发现3个小问题:

1. 外籍患者英文预约,姓名格式有误(中文姓名转英文乱码)

2. 药房库存没有自动预警

3. 医生打印处方模板偏小

小陈团队48小时内全部修复:

1. 姓名格式改为”姓在前,名在后”,符合国际习惯

2. 增加库存预警功能

3. 调整打印模板,适配纸张

“这响应速度,比我想象的快。”林院长说。

开业前5天:正式切换

试运行3天后,系统稳定。软佳团队建议:直接切换,无需再回旧系统(因为是新机构,无历史数据)。

切换那天,小陈和同事驻场支持。开业前3小时,所有员工最后一次培训,然后系统正式启用。

开业当天,林院长站在大厅观察:患者通过微信预约,到院后扫码签到,分诊屏自动叫号,医生在平板上开处方,药房实时接收,收费自动计算。

“一切流畅。”她心里一块石头落地。

更让她满意的是:一批外籍患者就诊,从预约到取药,全程英文界面,无障碍沟通。这在深圳的外资门诊市场上,是差异化优势

开业后第一周:数据与反馈

林院长坚持每天查看系统后台数据:

指标 目标 实际 评价
系统可用性 >99% 100%
患者平均等待 <30分钟 28分钟
医生投诉 <2起/周 0
系统操作问题 <5次/天 2次(已解决)
培训满意度 >80% 92%

与外籍患者交谈,他们对多语言界面赞不绝口。”这是我在中国看过的最顺畅的诊所。”一位美国患者说。

复盘会上,林院长算了一笔账:

“如果我们选了某大厂6个月实施周期,我们要推迟5个月开业。5个月的门诊收入,按日均50患者、人均500元算,就是:

50人 × 500元 × 30天 × 5个月 = 375万元。

“而我们用软佳,不仅准时开业,还省了这375万的潜在损失。

“软佳年费1898元,这钱花得太值了。”

财务总监补充:”更重要的是,我们开业即盈利,现金流正向。如果延期,还要继续付租金、工资,压力巨大。”

现在,当有同行问林院长”门诊系统怎么选”,她会先说:

“先问自己两个问题:

1. 你有多长时间?

2. 你的核心需求是什么?

“如果时间紧(3个月内要上线),选软佳这种标准部署快的;

如果时间充裕(6个月+),且需要大量定制,可以考虑大厂。

“但别忘了算时间成本。对创业门诊,时间就是生命线,晚开业一天,就是几万损失。

“软佳2-3周的标准部署,对我们这种急着开业的,是救星。”

回想那个盯着”60天倒计时”的下午,林院长感慨:在医疗行业,时间不仅是金钱,还是患者的信任

早一天开业,早一天服务患者;早一天上线,早一天获得数据。

软佳用2周时间,帮她抢回了5个月。

声明:本文基于真实客户案例改编,机构名称、人物均为化名,数据为试点统计,实际效果因机构准备充分程度、网络环境、人员配合度而异。实施周期仅供参考,具体以实际评估为准。

核心金句:

“对创业门诊,时间就是生命线。”

“2周上线 vs 6个月,抢回的不是时间,是生存空间。”

“快的不是软件,是流程的成熟。”

互动话题:

如果您的新门诊3个月内必须上线,您会选择快速部署还是长周期定制?

在系统选型中,实施周期是否是您的重要考虑因素?为什么?

您愿意为’快’支付溢价吗?快多少天值得多花多少钱?


立即免费试用门诊系统https://app.kmhis.com/
International Versionhttps://app.kmhis.com/multi/
了解软佳门诊管理系统详情https://www.kmhis.com/outpatient-management-system.html


扫码预约

手机扫码试用患者预约。请勿输入个人真实信息(点击图片可查看原图)

支持8种语言:简体中文、繁体中文、香港中文、English、藏文、泰文、老挝语、越南语


说真的。这类问题我见过太多了。每次看到医院同事为选型头疼。我就想,要是早点有人把这些经验分享出来就好了。毕竟。选择不对。后面全是麻烦。选择对了。省心省力。还能提升整个机构的运行效率。希望这篇能帮到正在纠结的你。

你如果有具体需求。也可以去 www.kmhis.com 看看。那里有更详细的技术方案和案例。

两千张表,三百万病人:一场没有”撤销”按钮的迁移

“如果现在停止迁移,数据会不一致,永远回不去了。”

凌晨两点,XX医院数据中心。老周盯着屏幕上的进度条,手在发抖。

迁移进度:87%。

总数据量:2.3 TB。

Tables 数量:2176张。

涉及的核心业务:三百万病人的历史病历、五年门诊记录、三年住院档案。

如果失败,后果不堪设想。

但迁移已经开始,没有”撤销”按钮。

1. 为什么这个迁移这么难?

这次迁移,不是简单的”升版本”,而是从旧架构V3.0,迁移到新架构V4.0

两个架构的区别:

– V3.0是单体数据库,所有业务数据在一张库

– V4.0是微服务架构,业务数据分库分表:门诊库、住院库、药房库、财务库、病历库…

以前的迁移,只需要在同一个数据库里改表结构,数据不动——这次,要把数据从”一张大饼”拆成”五块小饼”,还要保证每块小饼都能重新拼回原来的样子(如果失败回滚)。

难点:

1. 数据拆分逻辑复杂:比如门诊缴费记录,原来在payment表里,现在要拆成paymentheader(支付头)和paymentitems(支付明细);还要关联到outpatient_visit(门诊就诊)表。拆分规则涉及六张表。

2. 历史数据质量堪忧:三年积累的数据,有很多”脏数据”——重复记录、缺失字段、编码错误(比如性别填了”未知”),这些在V3.0时代都容忍了,但V4.0的schema有严格约束,脏数据会导入失败。

3. 没有”试错”机会:迁移窗口只有两天(五一假期门诊量少)。两次迁移机会——第一次失败,第二次必须在12小时内完成,否则影响初二开诊。如果两次都失败,就只好延期,等着杨院长问责。

老周带人准备了三个月:

– 写迁移工具(自己开发的data-migrator

– 清洗脏数据脚本

– 回滚方案

– 全量演练三次,每次都发现问题,每次都改,第三次演练才成功

但演练再成功,也不是真迁移。

2. 迁移开始后,第一个坑:脏数据

晚上八点,迁移开始。

前两个小时顺利:系统库、用户表、权限表…都是一马平川。

十点,开始迁移核心业务数据。

payment表开始迁移,1%…2%…

突然,报错。

“`
ERROR: Violation of NOT NULL constraint: column ‘patient_id’ cannot be null
“`

日志里指明,有一条记录的patient_id是NULL。

这是脏数据。

老周让小吴排查:SELECT COUNT(*) FROM payment WHERE patient_id IS NULL

结果:73条。

这些记录,都是V3.0时代的老数据,可能是创建记录时系统bug,patient_id没填。

小吴说:”跳过这73条吧,不影响整体。”

“不行。”老周说,”如果跳过,对账的时候会发现门诊对不上。而且,如果这73条都是大额缴费,财务损失谁负责?”

他们做了个决定:现场清洗

写了一条UPDATE语句,试图从其他表关联补全patientid。但关联发现,这73条记录对应的visitid也缺失,无法追溯到具体是哪次就诊。

死循环。

“只能手工造一个patient_id了。”小吴说,”造一个虚拟患者,把这73条付款挂到他名下。等迁移完成,我们在新系统里加一个’未知患者’账户,把这些数据放进去,后续再处理。”

老周犹豫。虚拟数据虽然能过关,但数据准确性打了折扣。

“有没有其他办法?”

“或者,我们暂停迁移,先回滚,把脏数据彻底清理完再迁?”

回滚意味着放弃这次窗口,五一假期只剩一天了,不够。

时间不等人。

老周咬了咬牙:”现场清洗——把有问题的数据,标上’待处理’标签,迁过去后我们在新系统里专门建一个’脏数据沙箱’,隔离存放。”

这是妥协,但迁移不能停。

3. 第二个坑:数据不一致

凌晨一点,进度到63%。

小吴发现一个问题:visitdate字段,在V3.0里是datetime类型,V4.0里拆分成visitdate(日期)和visit_time(时间)。迁移工具把小吴写得有bug:在拆分日期和时间时,时区处理错了。

V3.0存储的是本地时间(东八区),迁移工具当成UTC时间处理,减了8小时。

结果:所有就诊时间的visit_time,都比实际时间晚8小时。

比如一次早上8点的就诊,迁过去后变成了凌晨0点。

“天呐…”小吴脸白了。

老周也傻了。

这不是小问题。时间错误,会影响排班、统计、甚至医保结算(医保要求精确到小时)。

“修复这个bug,但已经迁过去的数据怎么处理?”

更可怕的是:已经迁了63%的数据,现在发现一个重大bug,是继续迁(错上加错),还是回滚?

继续,所有数据都错,无法挽回。

回滚,63%的数据要清理,重新迁,时间不够。

老周深吸一口气:”调出这个bug的影响范围数据。我们现场修复——迁过去的63%,我们另写一个’修正脚本’,把时间加8小时。”

小吴心算了一下:数据量800万条,修正脚本跑一遍要2小时。

“时间够吗?”

“不够也要够。”老周说。

4. “修正脚本”成为赛跑

老周和团队吃了两片咖啡因,开始写修正脚本。

脚本逻辑很简单:

“`sql
UPDATE outpatient_visits
SET visit_time = DATEADD(hour, 8, visit_time)
WHERE visit_time IS NOT NULL
“`

但要跑800万行,必须在2小时内完成,否则夜深了,医院的业务开始恢复,没机会再改。

他们优化:

1. 分批更新,每次10万行,commit 后继续

2. 加索引:在visit_time上建临时索引,加速 update

3. 关掉binlog,减少IO

4. 调大innodbbufferpool_size,确保数据在内存里

脚本跑起来,每分钟更新12万行。

一小时,600万。

凌晨三点,修正完成。

迁移继续。

5. 最后一个坑:外键约束冲突

早上七点,进度97%。

只剩最后一批数据迁移:prescription(处方)表。

报错:

“`
ERROR: Cannot add or update a child row: a foreign key constraint fails (`prescription` constraint `fk_prescription_visit`)
“`

意思是:有一条prescription记录,引用的visitid,在outpatientvisit表里找不到。

脏数据 again。

但这次很奇怪:前96%的数据都关联成功,为什么最后3%会丢?

小吴排查:最后这批数据,是2024年12月31日跨年的那批。那几天系统做了一次数据归档——把半年前的记录移到历史库。

但归档工具可能有bug,把某些visit_id漏了。

“跳过吧,”小吴说,”就几条处方,影响不大。”

“不行。”老周说,”处方是核心业务,漏一条,病用药记录就不全。而且,这是系统性问题的体现——如果这里漏了,其他地方呢?”

他们决定:现场补数据

方法:从旧库(V3.0)里,把这批visit_id对应的记录,手动补出来,再导入新库。

旧库还没关,可以查。

但旧库是生产环境,不能直接操作。他们只能查,不能改。

查询:SELECT * FROM outpatientvisit WHERE visitid IN (xxx, yyy, zzz)

发现这三条visitid对应的记录,已经被归档到outpatientvisit_history表了。

迁移工具没考虑到这种情况——只迁了主表,没迁历史表,导致引用断裂。

小吴把这些历史记录也迁过去,但迁到outpatient_visit主表(违反了业务逻辑,历史记录不应该混在主表里)。

“标记为历史记录。”老周说。

6. 100%完成后,还有验证

早上八点,迁移工具显示:100%。

所有人松了一口气。

但老周没放松:”迁移完成,不算完成;数据验证通过,才算完成。”

他们有一套验证流程:

1. 行数对比:每张表的记录数,新库 vs 旧库,差异率<0.1%

2. 总和校验:对金额、数量等关键字段,做SUM对比,应该相等

3. 样本抽查:随机抽取1000条记录,逐字段对比,应该一致

4. 业务逻辑验证:跑一遍核心业务流程(挂号→开处方→缴费),结果应该一致

前三个通过,第四个出问题。

模拟一次门诊全流程:挂一个号,开三个药,缴费。

在V4.0里,挂号的visitid,和处方的visitid,对不上。

又一轮排查发现:visit表的id字段是自增的,迁移过程中,新库的自增起点没设置对,导致新生成的ID和旧的不一样。但prescription表里的visit_id是直接迁过来的(旧的ID值),而新挂号的ID是新产生的(新的自增值),两者当然对不上。

“这是一个’活数据’问题,不是迁移问题。”小吴说。

老周明白了:迁移只迁了历史数据,但迁移完成后,新产生的数据用的ID和旧数据不连续。这会影响对账、追溯等需要全局ID唯一性的场景。

解决的方案:重置自增ID的起点,让它从旧库的最大ID+1开始。

但问题是:迁移后已经产生了一条新挂号记录(验证用的),ID是1。重置起点后,这条记录的ID会和后面的冲突。

只能删除这条验证数据,重置ID,再重新验证一次。

折腾到中午十二点,全部通过。

7. 事后反思:我们做对了什么?

这次迁移后,老周写了长篇复盘。

他的结论:

1. “现场清洗”是必须的能力

– 不要指望数据100%干净再迁

– 要能在迁移过程中,实时发现脏数据,实时处理(跳过、修正、隔离)

2. 修正脚本应该提前准备好

– 不是所有bug都能在迁移前发现

– 为每一类可能的数据问题,提前写好”修正脚本模板”,迁移时填参数就能跑

3. 验证必须自动化

– 人工抽查不够,要有程序自动跑完整的数据验证流程

– 验证通过率应该>99.99%

4. 要有”回滚点”概念

– 每完成一个业务单元(如门诊库),就做一个”回滚点”

– 后面的阶段失败,可以回滚到这个点,而不是全部重来

5. “迁移”不只是”搬数据”

– 还包括:ID生成策略、自增主键连续性、时间戳时区、字符集转换…

– 任何细节出错,都会导致业务逻辑错误

互动话题

你经历过最复杂的数据迁移是什么?有什么经验教训?

> 基于真实医院场景改编,人物均为化名


立即免费试用门诊系统https://app.kmhis.com/
International Versionhttps://app.kmhis.com/multi/
了解软佳门诊管理系统详情https://www.kmhis.com/outpatient-management-system.html


扫码预约

手机扫码试用患者预约。请勿输入个人真实信息(点击图片可查看原图)

支持8种语言:简体中文、繁体中文、香港中文、English、藏文、泰文、老挝语、越南语


说真的。这类问题我见过太多了。每次看到医院同事为选型头疼。我就想,要是早点有人把这些经验分享出来就好了。毕竟。选择不对。后面全是麻烦。选择对了。省心省力。还能提升整个机构的运行效率。希望这篇能帮到正在纠结的你。

你如果有具体需求。也可以去 www.kmhis.com 看看。那里有更详细的技术方案和案例。

那个投诉我们的医生,后来成了我们的”宣传员”

“我要举报你们!”

电话那头的声音像是要吃人,每一个字都带着怒火,透过听筒冲击着信息科办公室的安静。

信息科李主任刚端起茶杯,还没送到嘴边,就被这一嗓子震得手一抖,温热的茶水全泼在了深色的裤子上。他顾不上擦,趕緊示意值班的小姑娘把电话转到他这里。小姑娘脸色都有点发白,手忙脚乱地按了转接键。

李主任深吸一口气,努力让自己的声音听起来沉稳、专业:”您好,我是XX医院信息科李主任。您遇到什么问题,慢慢跟我说。”

对方沉默了三秒,能听到粗重的呼吸声。语气稍微缓和了一点,但依旧冲冲的:”我是外科的赵医生。你们系统刚才是不是崩了?我开医嘱,点了保存,提示’操作成功’,但护士站查不到!病人家属堵在我办公室门口,质问我为什么不给药、是不是在耽误治疗!你们知道我现在多难看吗?我作为医生,在病人面前一点信誉都没有!”

李主任心里”咯噔”一下,凉了半截。

系统崩了?不应该啊。运维部早上还发了日报,说所有指标正常,系统运行平稳,CPU使用率45%,内存占用62%,一切都在健康范围内。

但他没急着辩解,更没有说”不可能”或”我们系统没问题”——那只会激化矛盾。多年的客诉处理经验告诉他:当一个人在气头上时,任何辩解都会被当成推诿。

“赵医生,您说的这个情况,具體是什么时候发生的?出现了几个医嘱?涉及几个病人?” 李主任的声音很平静,甚至带着关切。

“大约二十分钟前。我开了三个医嘱,两个抗菌素,一个镇痛泵。都是同一个病人,术后镇痛和预防感染。都点了保存,界面显示’操作成功’,绿色对勾。但我刚离开电脑去隔壁手术室准备下一台手术,回来的时候护士站小妹说那些医嘱后台没收到,病人家属一直在走廊里吵,问我为什么药还没用上!你们系统是不是有问题?为什么点了保存却没存进去?”

李主任快速记着笔记:时间点、医嘱数量、病人情况。”您后来重新开过吗?病人用药耽误了吗?”

“开了!我又重新开了一遍,这次特意等到护士站确认收到才离开。但病人家属已经有意见了,觉得我们医生不靠谱,连个医嘱都开不准。你们这种系统如果连基本稳定都做不到,怎么做医疗?我要举报你们!”

1. 先别急着甩锅

李主任放下电话,脸色凝重。他没有丝毫犹豫,立刻打给运维部值班工程师小吴。

“小吴,查一下赵医生刚才操作的时间点,14:40左右,门诊HIS系统的日志。重点关注他的用户ID,看有没有异常请求和响应记录。务必快,病人用药可能受影响。”

五分钟后,小吴回复:”李主任,查到了。那个时间点(14:42-14:44),系统平均响应时间从正常的200毫秒飙升到15秒,但最终请求还是返回了’操作成功’状态码。理论上,医嘱应该写入数据库了。不过,有个疑点:响应超时时间设置的是10秒,但实际等了15秒才返回,说明后端可能还在处理,但前端已经超时断开?”

“那护士站为什么查不到医嘱?”

“可能数据还没同步到护士站缓存。或者…” 小吴停顿了一下,”或者那条医嘱的数据真的没写入数据库。系统在高延迟情况下,前端收到’成功’响应前就超时了,实际上后端处理失败了,但客户端不知道,这是一种’假成功’场景。”

李主任瞬间明白了。这是典型的”假成功”问题——系统响应太慢,客户端等不及HTTP响应完成就显示成功,但后端可能还在处理,甚至处理失败了,数据根本没存进去。

他做了一件让所有人都意外的事:先不追查系统问题,而是确保病人用药安全

他先回电话给赵医生,语气沉稳而诚恳:”赵医生,我们技术团队正在紧急排查,已经定位到疑似’假成功’问题。您先别急,病人用药的问题,是第一位的。我马上联系护理部陈护士长,请她们立刻核实医嘱状态,手动执行缺失的医嘱,确保病人用药不耽误。病人的安全比我们的面子重要。”

然后他立即联系护理部陈护士长,简明扼要说明情况,请护士站马上核对14:40后系统显示”已保存”但护士端查不到的医嘱,并手动补录执行。陈护士长很配合:”明白,我立刻安排护士核查,优先保证病人用药。”

这一步,先解决病人的问题,而不是先追究谁的责任或急于自证清白——这是李主任多年客诉处理总结的第一原则。

2. 真相:一个被遗忘的定时任务

两小时后,问题初步定位。

运维工程师小吴带着根因分析报告来到李主任办公室。他黑了眼圈,但眼神里有一丝如释重负。

“李主任,根本原因找到了。是一个数据库清理定时任务导致的连锁反应。” 小吴打开笔记本,展示了一堆SQL执行日志。

上周,第三方服务商在远程维护时,执行了一个清理历史数据的存储过程。这个存储过程本是V3.0时代用来清理”医嘱状态同步表”三个月前的数据,但配置参数错了——它删除了全部历史数据,而不是仅删除三个月前的。更糟糕的是,删除后重建索引的任务失败了(因为磁盘空间不足且没有告警),导致”医嘱状态同步表”失去了索引,查询从原来的200毫秒飙升至15秒。

“为什么会出现这种情况?”李主任问。

小吴苦笑:”这个定时任务,是V3.0时代留下的,V4.0迁移时本应该删掉,因为新架构用消息队列同步医嘱状态,不再依赖这个表。但没人记得它还在运行。上周服务商清理表空间,可能看到这个表很大,就顺手执行了清理,但不知道它的重要性,也不清楚删除后必须重建索引。” 他顿了顿,”有监控吗?有的。这个表的查询延迟有监控,但告警级别设的是’警告’(延迟超过5秒),而值班员那天同时收到几十条告警,这个就漏过去了。”

李主任沉默了。他意识到,问题不是技术复杂,而是管理疏忽和知识断层。系统里有太多”历史包袱”:废弃的定时任务、没人敢动的老表、模糊的运维交接文档。就像一栋老房子,管线杂乱,没人清楚哪里是总闸、哪里是承重墙。

“这个表现在怎么样了?” 李主任问。

“索引已经重建,查询恢复到了100毫秒内。但我们检查了其他V3.0遗留下来的定时任务,又发现了3个类似的’定时炸弹’。” 小吴说,”有的删除重要日志,有的清理用户会话,还有一个会在每月1号凌晨把’门诊号源表’的历史记录归档到另一个数据库,但那个归档库三年前就下线了。”

李主任感到一阵后怕:如果这次不是赵医生碰巧投诉,问题可能还会隐藏更久,直到下一次大规模数据同步失败,影响更多人。

3. 紧急处理 vs 根本解决

当晚,小吴和团队熬了一个通宵,做了三件事:

1. 紧急修复: 重建索引,优化查询,把同步时间从15秒降到80毫秒。但仅仅快还不够——他们发现,即使查询降到80毫秒,如果前端超时设置为10秒,在极端情况下仍然可能出现”假成功”。于是他们调整了前端HTTP请求的超时时间,从10秒改为30秒,并对高负载时段的慢请求显示”处理中…”的友好提示,避免误导医生。

2. 临时补偿机制: 系统自动检查”假成功”场景。后端日志增加了一个标记字段,如果某个请求的处理时间超过3秒,会被标记为”高风险”。系统定时扫描这些高风险请求,检查它们的最终写入状态。如果发现请求返回了成功但数据实际未写入,自动发起补单操作,并通过短信或企业微信通知操作者(医生或护士)。补单操作是幂等的,不会重复创建数据。这样即使出现假成功,系统也会在几分钟内自动修复,病人不会等待。

3. 根因整改(系统性措施):

彻底清理废弃定时任务: 小吴列出V3.0迁移后所有遗留的定时任务清单,逐一确认是否还需要。最终删除了7个已废弃的任务,保留了23个真正需要的,并更新了配置文档。

所有定时任务必须有执行结果通知: 无论是成功还是失败,执行完成后必须发送通知给运维值班员。失败的任务会立即电话通知值班人员。团队还增加了一个定时任务”健康检查”——每晚8点自动执行一遍所有定时任务,看是否会报错或超时。

关键业务数据同步,启用双写校验: 医嘱状态同步这种关键链路,现在采用”双写校验”:主库写入后,异步同步到从库,然后一个后台进程每隔5秒对比两边数据的一致性。不一致时自动触发修复。这虽然增加了少量开销,但确保了数据可靠。

延长响应时间并优化前端等待体验: 前端团队配合,增加了更细致的加载状态提示,操作中显示”正在处理,请稍候…”而不是无反应;高延迟时给出”系统繁忙,预计需要X秒”的提示,管理用户预期。

工程量不小,但小吴和团队知道:客诉是一次警钟,如果不彻底整改,下次爆发可能更严重,影响更多病人。

4. 事后,赵医生的态度变了

三天后,赵医生主动找到李主任,是在一个工作日的上午。他敲了敲信息科的门,表情有些拘谨。

“上次是我太激动,不好意思。”赵医生说,声音比电话里低了很多,”当时病人家属围着,我心里急,语气不好。但你们系统确实有问题——这是事实,对吧?”

李主任请他坐下,倒了杯茶:”是,我们承认有问题。’假成功’和同步延迟,都是实实在在我们需要解决的缺陷。现在已经修复了,而且加了预防机制。”

“我听护士说,你们还加了’假成功’检测?系统会自动补单?”

“对。” 李主任详细解释了补单机制和双写校验,”以后如果出现超时或写入异常,系统会在后台自动补单,并通知操作者。不会让病人等,也不会让医生重复劳动。”

赵主任沉默了几秒,点点头:”那…我再试试。如果还有问题,我还找你们。”

一周后,系统运行稳定,没有再次出现同类客诉。更让人意外的是,赵医生在一次科室晨会上,主动提到了这次事件:”我说两句关于HIS系统的事。前段时间我投诉了一次,信息科反应很快,两天就定位问题、修复了,还加了自动补单功能。现在系统响应快多了,开医嘱、查结果,基本秒出。软佳这家供应商,还是靠谱的——出问题能及时解决,不推诿。”

在场的好几个医生都听见了。其中一位张医生后来真的遇到一次小问题(打印处方时格式错乱),他没有直接打客服电话抱怨,而是先给信息科发了条企业微信:”李主任,我这边打印处方有个小问题,能帮忙看看吗?”——这就是信任的建立。

李主任后来在内部复盘会上说:”没想到,一个投诉者,变成了我们的支持者。甚至开始为我们说好话。”

原因是什么?

李主任总结了四点:

1. 真诚的态度: 接到投诉后没有辩解,第一时间承认可能存在问题,并承诺调查。

2. 快速的行动: 两小时定位根因,当晚出修复方案,三天内上线补单机制。速度让客户看到诚意。

3. 有效的解决: 不仅修复当前问题,还做了系统性整改(清理废弃任务、增加监控、双写校验)。客户看到的是长效机制,不是临时打补丁。

4. 持续跟进: 一周后主动回访赵医生,询问是否还有问题,展示改进效果。

这四点组合起来,就是信任建立公式

> 真诚的态度 + 快速的行动 + 有效的解决 + 持续跟进 = 从投诉者到支持者的转变

赵医生后来真的成了信息科的”编外监督员”。每次新功能上线前,他会主动提出试用,并组织科室同事一起测;遇到其他科室同事抱怨系统,他会现身说法:”我之前也投诉过,但他们改得快、改得好,你现在用着不挺顺的吗?” 甚至在班子会上,他为信息科说了不少好话,强调”系统有问题是正常的,关键是态度和响应速度”。

有一次,信息科申请一笔预算做硬件升级,院里本来有顾虑,是赵医生在院长办公会上帮着说话:”钱要花在刀刃上。信息科那批人,我了解,做事靠谱,既然他们需要升级,肯定是有必要。” 这笔预算最后顺利批了下来。

李主任感慨:”一次危机,如果处理得当,反而能加深客户关系。我们不追求’不出问题’——那不可能——我们追求的是’出问题后让客户更信任我们’。”

5. 客诉处理的”黄金四步”

李主任后来在信息科内部培训中,总结了客诉处理的四步法:

第一步:先安抚,不辩解

– 客户投诉时,第一反应不是”不是我们的错”

– 而是”我理解您着急,我们立刻查”

– 先让客户情绪降温

第二步:先解决业务,再追技术

– 病人用药不能等,先手动执行医嘱

– 技术问题稳妥解决

– 不要让客户为技术问题买单

第三步:透明沟通,不隐瞒

– 找到根因后,主动告诉客户”是什么问题”

– 不要怕承认错误,坦承比掩盖更容易获得原谅

– 给出具体整改措施和时间表

第四步:行动跟上,不止于道歉

– 道歉是必须的,但光道歉不够

– 必须有具体整改,让客户看到变化

– 后续跟进,确保问题不再犯

6. 一次投诉,换来一个”代言人”

赵医生后来成了信息科的”编外监督员”。

每次新功能上线,他都主动试用,提建议;科室其他同事有问题,他帮着解释;甚至在班子会上,他为信息科说了不少好话。

李主任后来说:”没想到,一个投诉者,变成了我们的支持者。”

原因是什么?

真诚的态度 + 快速的行动 + 有效的解决 = 信任建立

7. 客诉的”价值”:把投诉变成礼物

这次事件后在季度客户大会上,周总(软佳)特意分享了赵医生的案例。他站在台上,语气诚恳:

“很多公司把客诉当成本,能躲就躲。能压就压,能删就删,生怕别人知道。我们把客诉当礼物。为什么?

因为投诉的客户,是还愿意跟你沟通的客户。他遇到问题,第一反应不是换供应商,而是找你——说明他还信任你,还希望你能解决。

真正不投诉的客户呢?沉默的客户,直接换供应商了,连解释的机会都不给你。你连他为什么走都不知道。

所以,我们感谢投诉。每一次投诉,都像一个警报器,告诉你系统哪里病了。如果你听不见这个警报,盲点就越来越大,直到下一次更大的故障。

更重要的是,每一次投诉解决,都是信任加深的机会。客户看到了你响应问题的态度和能力,他会觉得’这家公司靠得住’。赵医生从投诉者变成我们的支持者,就是最好的证明。

我常跟团队说:不要怕投诉,要怕的是没人投诉——那意味着客户已经放弃你了。”

8. 从”被动响应”到”主动预防”:客户成功体系的建立

这次客诉直接推动软佳建立了主动预警机制,从”救火”转向”防火”。

机制核心是三个联动:

1. 系统监控自动检测异常: 当系统响应时间连续5分钟超过3秒,或错误率突增超过1%,自动触发告警。

2. 客户成功经理主动介入: 告警触发后,系统自动给对应的客户成功经理发送企业微信消息,附上异常时间段和可能的受影响功能。客户成功经理不等信息,主动联系客户的对接人:”我们监测到系统在X时段有延迟,您那边是否遇到了操作卡顿?如果有,具体情况是什么?我们正在排查。”

3. 问题闭环反馈: 客户成功经理将客户反馈的问题录入工单,技术团队优先处理。问题解决后,客户成功经理再次联系客户,告知原因和整改措施,并确认是否满意。

这个机制运行后,效果立竿见影:

“主动发现”的问题占比从0%提升到35%:原来所有问题都是客户投诉后才知晓,现在有超过三分之一的问题在客户开口前就被发现并解决。

平均响应时间缩短了40%:因为问题发现得早,影响范围小,修复快。

客户满意度提升: 很多客户反馈:”你们现在比我们还关心系统稳定性,我们还没感觉到有问题,你们就来问了。”

周总在总结时说:”我们不再等投诉,我们主动出击。我们要让客户以为,问题从来不会发生——但实际上,它们发生之前就被消灭了。”

李主任也感受到了这种变化。以前是医院发现问题 -> 打电话投诉 -> 软佳排查 -> 修复,一两天过去了。现在是软佳的CSM提前联系:”李主任,我们监测到昨晚系统有波动,您那边有没有异常?如果有,我们已经在查了。” 这种”倒置”的服务模式,让XX医院对软佳的评价越来越高。

互动话题

在医疗信息化过程中,您是否遇到过印象深刻的客户投诉?当时是如何处理的?结果如何?

如果您是赵医生,第一次投诉后没有获得满意解决,您会怎么做?欢迎分享您的看法和经验。

> 基于真实医院场景改编,人物均为化名


立即免费试用门诊系统https://app.kmhis.com/
International Versionhttps://app.kmhis.com/multi/
了解软佳门诊管理系统详情https://www.kmhis.com/outpatient-management-system.html


扫码预约

手机扫码试用患者预约。请勿输入个人真实信息(点击图片可查看原图)

支持8种语言:简体中文、繁体中文、香港中文、English、藏文、泰文、老挝语、越南语


说真的。这类问题我见过太多了。每次看到医院同事为选型头疼。我就想,要是早点有人把这些经验分享出来就好了。毕竟。选择不对。后面全是麻烦。选择对了。省心省力。还能提升整个机构的运行效率。希望这篇能帮到正在纠结的你。

你如果有具体需求。也可以去 www.kmhis.com 看看。那里有更详细的技术方案和案例。

一个看似不可能的任务:我们在三天内解决了XX医院的”绝症”问题

“你们能不能在三天内解决这个问题?如果不能,我们就换人了。”

会议室里,XX医院信息科李主任的声音很平静,但每个字都像一块石头,砸在我们项目经理小张的心上。窗外的春日阳光斜斜地照进来,照亮了空气中漂浮的尘埃,却照不进会议室里压抑的气氛。空调吹出的冷风扫过每个人的后背,让人不寒而栗。

这是合同签订后的第二个月,我们的HIS系统在XX医院上线测试的第五天。第五天,一个我们从未遇到过的数据同步问题浮出水面——门诊缴费数据无法实时同步到住院系统。简单说,病人在门诊交了费,住院处查不到,导致重复收费、漏收费,护士站怨声载道,财务科王科长已经来投诉三次了。

我们派出的工程师小刘已经熬了三个晚上,问题依旧。他黑着眼圈,头发凌乱,手指在键盘上飞舞,屏幕上的日志滚动如瀑布。测试环境一切都好,一到生产环境就出问题。日志里只有一堆”timeout”和”connection reset”,看不出所以然。

李主任给我们下了最后通牒:”三天,要么解决问题,要么走人。”他的眼神里没有威胁,只有一种深深的疲惫——那是被问题折磨了一个月后的绝望。

1. 表面的技术问题,背后是管理混乱

回公司的路上,车里没人说话。

车窗外的城市灯火璀璨,但车内一片阴沉。我们在技术圈子里摸爬滚打这么多年,什么疑难杂症没见过?数据库死锁、网络分区、应用OOM…但为什么这次被一个简单的数据同步卡住了?

小张盯着窗外飞驰而过的街景,思绪万千。他想起三年前在另一家医院做数据迁移时,也遇到过类似问题,但那次只用了半天就定位了。这次为什么这么难?

小刘突然说:”哥,我总觉得问题不在代码里。”

“那在哪里?”

“在医院网络的防火墙策略。我怀疑他们在应用层做了流量限制,或者中间有某个设备在做SSL拦截。”

小刘是公司最年轻的高级工程师,26岁,话不多,但一针见血。他打开笔记本电脑,快速画出数据流向图:从门诊收费终端,到HIS应用服务器,再到住院数据库,中间经过三道网络设备——防火墙、WAF、负载均衡。

“如果中间有设备做深度包检测,可能会拦截某些SQL语句。”小刘说。

张哥点点头:”但为什么测试环境没问题?”

“因为测试环境没有那三道设备,直接连数据库。”

2. 七台设备,两个未知节点

第二天一早,我们没带电脑,只带了笔记本和笔,直接去了XX医院的网络机房。

机房在住院部地下二层,恒温恒湿,蓝色LED灯闪烁。机房管理员老陈是个四十多岁的中年人,戴着眼镜,表情很冷淡,正在低头修一台交换机。

听说我们要查网络设备,他直摇头:”你们厂商就是喜欢折腾设备。问题是你们的软件有问题。”

“陈师傅,”小刘递上一支红塔山,”我们不急,就想看看贵院的网络拓扑,特别是HIS系统这条链路上有哪些设备。”

老陈犹豫了一下,接过烟:”跟你们说了也没用,这是内部网络结构,涉密。”

“我们签了保密协议。”李主任也来了,掏出协议给他看。

他扫了一眼,终于松口:”好吧,就看看,不能拍照。”

老陈拿出一张A3纸,画了一张拓扑图,用不同颜色的笔标注:

从HIS服务器(位于信息中心机房)到住院收费终端(分布在门诊楼、住院楼各楼层),中间经过七台设备:

1. 核心交换机(华为S7700,位于信息中心)

2. 防火墙(深信服AF-1000,位于信息中心)

3. WAF(Web应用防火墙,自研,位于安全接入区)

4. 负载均衡(F5 BIG-IP,位于应用前端)

5. 路由交换机(思科Catalyst 6500,住院楼核心)

6. 二层交换机(华为S5700,各楼层)

7. 住院收费终端(PC机,运行Windows 10)

问题出在数据从第3台WAF到第4台负载均衡之间。我们的服务调用住院数据库接口,先过WAF做安全检测,再过负载均衡分发到住院应用服务器。

小刘指着WAF和负载均衡之间的连线:”这里,我们要抓包。”

“抓不了。”老陈说,”WAF是省信息中心统一部署的,我们没有管理权限,只有使用权限。抓包要找省里审批。”

“那WAF的策略是谁维护?”

“省信息中心安全科。他们每季度更新一次规则,但从不告诉我们具体规则是什么。”

张哥心里一沉。这意味着我们要联系省里,走流程,申请排查。七天?一个月?都不够。

小刘却笑了:”哥,我有个想法。”

3. 绕开防火墙,但不能绕过规则

小刘的想法是:不直接连接住院数据库,通过门诊数据库做中转

“如果我们把门诊缴费成功的记录,先存到门诊库,然后让医院现有的数据同步工具(他们有个ETL任务,每5分钟同步一次),把数据从门诊库同步到住院库呢?”

张哥摇头:”住院实时缴费怎么办?病人缴费后要马上生成住院预交金,如果同步有延迟,病人没法办理手术。”

“我们可以加一个中间表,记录所有待同步的数据,再写一个监听程序,确保每条缴费记录都同步到住院库。同步失败就重试,重试三次还失败,就人工介入。”

“但如果数据不一致,财务对账会出大问题。”

“我们可以做到99.99%一致。”小刘眼神坚定,”我在之前项目用过类似方案。”

张哥知道,这方案最大的风险在于:这只是一时之计。如果长期这样,数据延迟会导致住院处无法实时掌握病人费用,影响医疗决策。

而且,一旦住院库有问题,门诊库也会被拖累——数据链路变长了,故障点变多了。

“这个方案能撑多久?”

“至少撑到我们拿到省里的WAF策略调整许可。”小刘说,”我打听到,省信息中心下个月要做一次WAF规则优化,我们可以把我们的情况报上去,申请白名单。”

张哥想想,这也是无奈之举。

4. 说服的关键:不是技术,是态度

我们带着方案去见李主任。

这一次,张哥没有带笔记本,而是带了一叠A4纸,上面手绘了数据流对比图:现状(直接连住院库)vs 临时方案(门诊库中转)。

他开门见山:”李主任,我们有两个方案。方案A:继续等省里审批,预计时间1-2个月,期间系统会持续不稳定。方案B:我们先上线一个临时方案,绕过WAF的误拦截,保证业务正常,同时我们去省里协调。”

李主任皱眉:”临时方案会不会影响数据安全?”

“不会。数据仍在医院内网流转,只是多了一步中转。而且,我们会加日志记录,所有数据流动可追溯。”

“那什么时候能彻底解决?”

“如果省里配合,一个月内。如果不配合,我们只能长期用这个方案,但我们会持续优化,确保延迟在3秒内。”

李主任看向网络管理员老陈:”你觉得呢?”

老陈说:”WAF确实是我们控制不了的。我建议先临时方案,同时周总你们去省里跑,我们医院也给省里发个函,说明业务影响。”

5. 72小时不眠不休

接下来的72小时,是我们职业生涯中最漫长的一段。

小刘带人写中转服务,这是一个Java应用,要监听门诊库的binlog,捕获缴费成功事件,然后写入住院库的中间表,再触发住院库的同步。

张哥在医院现场协调:

– 第一天:改造门诊收费模块,增加数据双写(同时写门诊库和中间表)

– 第二天:开发和部署中转服务,与住院系统联调

– 第三天:数据一致性验证,灰度上线

李主任几乎没回家,吃住都在医院,随时决策。

第三天凌晨四点,系统终于上线。

上线前,我们做了三轮压力测试:

– 模拟门诊高峰,1000个并发缴费请求,中转延迟平均1.2秒,最大3秒

– 住院端查询,数据一致率100%

– 故障切换:如果中转服务挂掉,门诊收费仍能正常进行,只是同步暂停,人工补同步

李主任看着测试报告,紧绷的脸终于有了一丝松动:”上线吧。”

6. 事后复盘,我们做对了什么?

一周后,系统运行稳定。

李主任请我们吃饭。酒桌上,他举杯:”说实话,那三天,我没想到你们能搞定。”

“为什么?”

“换别家厂商,遇到我们这种’受制于省里’的情况,早就推脱了。你们没推脱,而是给我们一个临时方案,让我们业务不停摆。”

张哥说:”关键不是技术方案多巧妙,是不放弃。”

李主任点头:”而且你们没把我们当外人——所有的决策,都让我们参与;所有的风险,都提前告诉我们。这种透明,让我们很放心。”

7. 省里协调:一个月后的好消息

与此同时,张哥跑省里的工作也有了进展。

他找到省信息中心安全科的科长,是一个45岁的技术男。张哥没有直接要策略,而是先做了三件事:

1. 准备数据:统计了XX医院过去一个月因WAF拦截导致的业务异常次数(37次),以及影响的患者数量(约5000人次)

2. 提供方案:写了一份详细的白名单申请,只申请对HIS系统的特定接口放行,并附上了安全自评报告

3. 承诺责任:如果因为放行导致安全事件,由软佳承担全部责任

科长被诚意打动,两周后批复:同意对XX医院HIS系统加白名单,为期一年,期满可续。

消息传来,李主任第一时间打电话给张哥:”你们怎么做到的?”

“周总说过:(‘解决问题,要找到问题的根源’)。问题的根源不是WAF,是沟通。”

8. 这次事件,让我们明白的五个道理

第一,技术问题往往是管理问题的表象

如果XX医院自己有WAF策略管理权,问题早就解决了。但因为他们把安全外包给了省里,就失去了主动性。我们作为供应商,只能适应环境,不能改变环境。

第二,临时方案不是妥协,是策略

永久方案需要时间,但业务不能等。临时方案的价值是赢得时间,同时不让客户受损。很多厂商不愿意做临时方案,觉得”不完美”,但客户才不管完美不完美,客户只要能用。

第三,信任建立在”困难时刻”

如果一切顺利,客户看不出供应商的差别。只有在困难时刻,才知道谁靠得住。那72小时,我们所有人都拼了,这种拼劲,客户 seeing 到了。

第四,跨层级协调是能力

我们不仅要解决技术问题,还要学会和省里、和其他部门协调。这种能力,比技术能力更重要。

第五,透明沟通比技术方案更重要

客户不关心你的技术多高深,客户关心的是:问题能不能解决?什么时候解决?过程中有什么风险?把一切都透明化,客户就不会猜疑。

9. 三个月后:系统稳定,客户满意

三个月后,XX医院HIS系统可用率达到99.95%,数据同步延迟平均0.5秒,住院处投诉率为零。

杨院长在一次IT座谈会上说:”我们信息化,最怕两种供应商:一种是技术不行,一种是服务不行。软佳两种都不占。他们技术扎实,服务到位,关键是有担当。”

这次事件,也成了软佳内部的经典案例,被写进新员工培训教材,标题是:《如何在72小时内解决一个看似不可能的问题》。

10. 核心观点:问题的大小,取决于你的态度

小刘后来在一次技术分享会上说:

“很多问题,看起来很大,是因为你把它当成’问题’。

如果你把它当成’任务’,就有思路;

如果你把它当成’机遇’,就有动力;

如果你把它当成’证明自己的机会’,就一定能解决。

(‘态度决定高度,高度决定角度’)

你用什么样的心态面对问题,问题就会以什么样的结果回报你。”

互动话题

你遇到过最棘手的技术问题是什么?是怎么解决的?

> 基于真实医院场景改编,人物均为化名


立即免费试用门诊系统https://app.kmhis.com/
International Versionhttps://app.kmhis.com/multi/
了解软佳门诊管理系统详情https://www.kmhis.com/outpatient-management-system.html


扫码预约

手机扫码试用患者预约。请勿输入个人真实信息(点击图片可查看原图)

支持8种语言:简体中文、繁体中文、香港中文、English、藏文、泰文、老挝语、越南语


说真的。这类问题我见过太多了。每次看到医院同事为选型头疼。我就想,要是早点有人把这些经验分享出来就好了。毕竟。选择不对。后面全是麻烦。选择对了。省心省力。还能提升整个机构的运行效率。希望这篇能帮到正在纠结的你。

你如果有具体需求。也可以去 www.kmhis.com 看看。那里有更详细的技术方案和案例。