杨院长生日,收到了一条”奇怪”的祝福短信:客户关系维护的长期主义与”非销售”艺术

杨院长生日那天,早上八点,手机响了。

一条短信:

> “杨院长您好,我是昆明软佳的小张。您最近在忙关于HIS系统二期的事情吗?听说你们想加一个慢病管理模块,我们最近做了两家医院的方案,如果需要参考,我可以发给您。——小张,138xxxx”

杨院长愣住了。

她确实在考虑HIS系统二期,要加慢病管理,但还没跟任何人说。连信息科李主任都不知道。

这个”小张”怎么知道的?

她回复:”谢谢,你怎么知道我考虑这个?”

小张秒回:”上次您开会时说’要关注慢病患者管理’,我记下了。刚好我们公司最近在做这方面的产品,就跟您分享一下。”

杨院长心里一暖。

这是个用心的销售。

但更让她感慨的是:这是她收到的唯一一条”生日祝福”,不是群发的,是有实质内容的

1. “客户关系”不是”节日群发”:小张做对了什么?

杨院长把这事跟李主任说了,顺便问:”你们信息科跟软佳谁对接?”

“小张,客户成功经理。”

“他怎么样?”

李主任苦笑:”这就是小张啊。软佳的客户经理,跟华通的赵某完全是两种人。”

赵某是华通的销售,逢年过节群发祝福短信,内容都是”尊敬的X总,值此佳节…”,连名字都不带换的,杨院长收到过好几次,直接删。

但小张不一样。

“你知道他做了什么吗?”李主任问。

杨院长摇头。

“去年冬天,我们儿科有个新生儿严重黄疸,需要转上级医院。但转院要HIS系统出转诊单,那功能我们没有买。小张知道后,连夜联系他们公司,免费给我们开了个临时授权,让我们用了一个月。”

“这种事,他们收费吗?”

“不收。他说’病人要紧’。”

“然后呢?”

“然后我们就买了那个模块。但不是因为他’献殷勤’,是因为他真的理解我们的需求。”

2. “销售”和”客户成功经理”,有什么区别?

小张的身份,从销售,变成了”客户成功经理”。

这是软佳两年前做的组织变革。

以前,销售签完合同就交给实施团队,自己再去追新客户。实施团队交付完,交给运维,自己再去实施下一个项目。运维解决报障,但不会主动联系客户。

客户在软佳的体验,是(“断点式服务”)——每个环节都有人,但环节之间有 gap。

变革后,每个客户,从销售开始,就有一个(“成功经理”)全程跟进。

小张就是XX医院的成功经理。

他的职责不是”卖更多产品”,而是”让客户成功”。

具体做:

每月至少一次上门拜访,不聊销售,只了解需求

每季度提供一份”系统健康报告”(性能、故障、使用率)

每半年做一次”需求工作坊”,帮客户梳理下一步要做什么

客户遇到任何问题,第一个联系他,他协调公司内部资源

“这不就是售后吗?”杨院长问。

李主任:”售后是被动响应,客户有问题才找你。成功经理是主动服务。他会提前发现客户可能遇到的问题。”

比如,小张最近发现XX医院的”医患沟通记录”功能使用率很低——这个功能是医生和患者在线沟通的,但医生不爱用。

小张没直接问”为什么不用”,而是去门诊待了一上午,看医生怎么和病人交流。

他发现:

– 医生在诊室,电脑上一边开医嘱一边跟病人说话,没空打字

– 而且有些患者是老人,不会用手机看消息

小张回去后,没跟客户说”你们得用这个功能”,而是提了个建议:把”医患沟通”和”语音病历”集成,医生说话,自动转文字发给患者

医院采纳了,这个功能的使用率从5%飙升到70%。

这就是(“卖解决方案,不是卖功能”)

3. “客户成功”怎么衡量?KPI决定行为

软佳给成功经理定的KPI,很奇怪:

客户健康度评分(系统可用率、故障次数、用户满意度调研)

客户续约率(不是”销售额”)

客户增购率(在原有合同基础上,买更多模块)

NPS(净推荐值)——客户是否愿意推荐给别人

小张的KPI里没有”本月签单金额”。

但奇怪的是,有了这个岗位,公司的:

– 续约率从70%提升到95%

– 增购率从20%提升到40%

– 客户流失率从15%降到5%

“因为客户感受到,你是真为他好。”杨院长说。

“赵某就 never 这样。”李主任说。

赵某也有KPI——”本月销售额”。所以他见客户,三句话不离”买这个模块””那个功能要不要””我们新产品很好”。

客户觉得他是来收割的,不是来帮忙的。

小张相反。他上门,first 问的是”最近有什么问题””什么功能不好用””你们明年准备做什么”。

问得多,说得少。

但问多了,他就知道客户真正要什么。

4. 生日短信的背后:长期主义的胜利

那天晚上,杨院长把小张发来的”慢病管理方案”研究了一下。

确实,做得很用心。方案里不仅有产品功能,还有:

– 三家已上线医院的运营数据(脱敏的)

– 患者满意度

– 医护人员使用率

– 投资回报率分析

这说明小张是真的调研过,不是随便发个模板来应付。

杨院长回复:”方案收到,很有参考价值。我们下周三开班子会讨论这个事,如果你方便,可以来参加,做个简短汇报。”

小张回复:”谢谢杨院长!我一定到,但不会推销产品,只分享案例。”

杨院长笑了。

她知道,下周三如果小张做得让她满意,二期项目很可能还是软佳的。即使不是全给他们,至少分一块蛋糕。

而这一切,都源于那条生日短信。

(杨院长不知道的是,那条短信,是小张花了两个小时写的——他查了杨院长半年的公开活动,发现她在一个学术会议上提到”慢病管理”,才有的放矢。)

5. 客户关系,不是”搞定一个人”,而是”搞定一个组织”

但小张也有失败的时候。

有一次,他极力推荐一个”智能分诊”模块,说能极大提升门诊效率——AI分诊,患者手机填写症状,系统推荐科室。

但信息科李主任试用了,说:”这玩意儿不实用。它让患者自己在手机上选症状,但很多患者描述不清楚,选错了,反而增加医生工作量。”

小张没坚持,回去跟公司说:”这个产品不适合XX医院,我们先不推。”

“那不等于放弃这个客户了吗?”同事问。

“不是,是更信任我们了。”小张说,”如果我们强推一个不适合的东西,客户会怀疑我们之前推的东西,是不是也不适合。”

这就是(“有时不卖,才是最好的卖”)

杨院长后来才知道这事。

“小张这个人,能处。”她说。

6. “关系”的三个层次:从交易到伙伴

李主任把软佳的客户关系维护,总结为三个层次:

第一层:交易关系

– 你给我钱,我给产品

– 履约即结束

– 容易替代(谁便宜选谁)

第二层:服务关系

– 有问题,响应快

– 有需求,能满足

– 有感情,但不多

– 不太容易被替代

第三层:伙伴关系

– 主动发现客户问题

– 帮客户规划未来

– 为客户的失败感到难过,为客户的 success 感到高兴

– 很难被替代——因为客户觉得你”懂”他

软佳在向第三层努力。

而华通,还在第一层——赵某每次来,就是”我们有个新功能,您要不要看看?”

7. 一个细节,让关系升华:搬家前的”免费检查”

去年冬天,XX医院搬新院区。

搬家前一天,小张带着两个工程师, arrive 医院, free 帮他们检查新院区的网络、机房、AP信号。

“这不是你们的事吧?”李主任问。

“是也不是。”小张说,”如果你们新院区网络有问题,我们的系统用着也不顺。帮你们,也是帮我们自己。”

他们忙到晚上十点,发现一个机房的网线标签贴错了(核心交换机和汇聚交换机接反了),及时纠正。如果搬家后才发现问题,得折腾三四天。

杨院长听说后,送来一箱水果:”你们真是…”

“应该的。”小张说。

杨院长 later 说:”搬家那次,让我 seeing 了什么是’靠谱’——不是签了合同才负责,是客户的事都是事。”

8. 关系的本质:把客户当成”活生生的人”

小张后来在一次内部培训上说:

“很多人觉得’客户关系’就是送礼、请吃饭、逢年过节送月饼。”

“但真正的客户关系,是(‘把客户当成活生生的人’)。”

他有KPI要完成,有领导要汇报,有病人要看,有投诉要处理。

你帮他把事做成,就是最好的关系。

你送他茅台,但他的系统三天两头崩,他 pressure 很大,他烦死了,他哪有心思喝茅台?

相反,你帮他解决一个问题,他记一辈子。

有时候,一句话的力量,胜过一万块礼品。

比如,客户生日,你送个蛋糕,不如发条短信说’记得您曾经提过X事,我帮您留意了,有进展’。

客户会觉得:你把我当人,你记得我说过的话。

这比什么都贵。

9. “客户成功经理”的制度设计:释放一线人员的善意

软佳的客户成功经理制度,有几个关键点:

① 独立性

– 成功经理不属于销售部门,也不属于实施部门

– 直接向”客户成功委员会”汇报(跨部门)

– KPI不与销售额挂钩

② 授权

– 可以调动公司内部资源(技术、产品、实施)

– 可以批准小额”免费服务”(如临时授权、紧急支持)

– 可以直接向高层反馈客户问题

③ 考核

– 客户NPS(占40%)

– 续约率(占30%)

– 健康度评分(占20%)

– 内部协作评分(占10%)

④ 客户数量

– 每个成功经理负责不超过15个客户

– 保证每月至少有一次面对面沟通

10. 长期主义的胜利:信任是最深的护城河

周总后来在一次内部会说:

“客户关系,是慢慢养出来的。”

不要指望签单时就亲如兄弟,而是:

– 第一次故障时,你响应快

– 第一次需求变更时,你理解

– 第一次升级时,你稳定

– 第一次续约时,你主动

每一次互动,都是一次”存款”或”取款”。

存多了,关系就稳了。

取多了,关系就崩了。

软佳的”客户关系账户”,一直在存钱。

华通的”客户关系账户”,一直在取钱(卖新功能、加价、推卸责任)。

所以,华通的客户,稍微有点风吹草动(谣言),就动摇。

而软佳的客户,即使有谣言,也不信——因为他们的”信任余额”够厚。

互动话题

你有过最感动的一次客户服务/售后服务经历吗?是什么让你觉得”值了”?

> 基于真实医院场景改编,人物均为化名


立即免费试用门诊系统https://app.kmhis.com/
International Versionhttps://app.kmhis.com/multi/
了解软佳门诊管理系统详情https://www.kmhis.com/outpatient-management-system.html


扫码预约

手机扫码试用患者预约。请勿输入个人真实信息(点击图片可查看原图)

支持8种语言:简体中文、繁体中文、香港中文、English、藏文、泰文、老挝语、越南语


说真的。这类问题我见过太多了。每次看到医院同事为选型头疼。我就想,要是早点有人把这些经验分享出来就好了。毕竟。选择不对。后面全是麻烦。选择对了。省心省力。还能提升整个机构的运行效率。希望这篇能帮到正在纠结的你。

你如果有具体需求。也可以去 www.kmhis.com 看看。那里有更详细的技术方案和案例。

当进口系统遇上中国门诊:一次国产替代的理性选择

上午10点15分,湖北武汉XX区第三医院信息科办公室的气氛凝重得能拧出水来。

财务科老李推门进来,把一张发票”啪”地拍在孙主任的桌上,声音里带着压抑的烦躁:”孙主任,这个进口系统的维护费又要交了,3万。”

孙主任今年39岁,在这家二甲医院负责信息化已经7年。五年前那个意气风发的下午,院领导大手一挥:”门诊系统要上就上最好的,进口的!”于是他们选择了某国际品牌HIS,买断12万,实施费3万,后续维护费每年2-3万。总投入早已超过20万。

孙主任放下手中的季度运维报告,接过发票,手指在”金额:30,000元”上划过,眉头紧锁。他快步走到白板前,拿起记号笔,在密密麻麻的费用追踪表上又添了一笔。窗外阴雨绵绵,办公室的灯光显得格外惨白。

“老李,这已经是今年的第几次了?”孙主任转身问道,声音沙哑。

“第三次。”老李叹气,”每次打电话给他们客服,都要等48小时以上。上次那个挂号模块的bug,拖了整整两周才修复。这钱花得…憋屈。”

孙主任把笔扔在桌上,在办公室里来回踱步。五年来,这个进口系统的问题像滚雪球一样越积越多:高峰期系统卡顿,诊室里的医生焦急地拍打键盘;中文界面是机翻稿,”cardiology”被翻译成”卡片学”而不是”心脏科”;定制一个新功能要走国际流程,8000元/人天,而且最少等一个月;本地服务商水平参差不齐,简单问题能拖一周;每次大版本升级都要重新买授权,几乎等于重新做一遍实施。

他停下脚步,盯着墙上的系统架构图——那复杂的模块结构,本应带来高效,却成了束缚。

“我们像在用一个’西洋骨架’,套在中国门诊的’身体’上。”孙主任在昨天下午的院务会上疲惫地说,”数据格式不符合国内规范,操作逻辑不符合医生习惯,响应速度跟不上门诊节奏。我们花了20多万,买了个’水土不服’。”

院长沉默良久,抬起头:”那怎么办?继续忍受?还是换?”

孙主任揉了揉太阳穴,回答得异常坚定:”我这两个月一直在调研国产系统,特别是软佳。24年专注医疗软件,服务了2000多家中国门诊。他们的年费不到2000,功能却一点不含糊——我在想,性价比可能远超我们想象。”

调研结果让孙主任震惊。

他对比了三家进口厂商和三家国产厂商,发现:

进口厂商A:12万买断,5年维护10万,总成本22万。界面全英文,中国医生用着别扭;定制要等一个月,收费8000/人天。

进口厂商B:18万买断,更高。声称支持中文,但翻译生硬;服务响应慢(48小时+)。

国产厂商X:5万买断,但系统老旧,界面落后,移动端体验差。

软佳:年订阅1898元,5年0.95万,不到进口的一半;界面现代,支持8种语言;功能对标进口,但更贴合中国门诊场景;服务团队昆明总部,响应<30分钟。

“这价格差距太大了。”财务老李说,”进口5年22万,软佳5年0.95万,差12.5万。够我们买两台新设备了。”

但院长有顾虑:”软佳名气不如进口,靠谱吗?”

孙主任准备了详细的功能对比:

维度 进口系统 软佳国产
价格(5年TCO) 15-25万元 0.95万元
中文/小语种 翻译质量参差 原生支持,质量高
本地合规 需二次开发 开箱即用
服务响应 48小时+ <30分钟
定制成本 8000元/人天 包含在订阅
升级频率 3-5年一次,收费 每月更新免费
数据迁移 复杂,收费 包含在实施

“进口不是不好,”孙主任说,”但它的大而全,是为欧美大医院设计的。我们的门诊规模、流程、规范,和它不匹配。

“软佳专做中国门诊24年,每一个功能都为国内场景优化。”

为了验证软佳的实际效果,孙主任专程去云南考察了两家使用软佳的医院。

昆明某社区医院:2018年从某进口系统切换到软佳。信息科主任说:”进口系统维护费太高,而且每次定制都要等很久。软佳订阅制,所有合理需求都包含,服务也快。”

泰国清迈诊所:Dr. Somchai分享:”我们评估过新加坡进口系统,年费3000美元,泰语支持弱。软佳国际版1299美元,泰语完整,操作流畅。”

孙主任问:”定制需求呢?”

Dr. Somchai笑:”我们提过增加一个’保险直付’功能,软佳两个月就上线了。进口系统说要走6个月评估流程。”

回到武汉,孙主任组织了核心团队和两家厂商(进口代表 vs 软佳)进行了一场”实战测试”。

测试内容:

1. 门诊挂号场景:模拟100人高峰预约

2. 医生工作站:开电子病历+处方+检查申请

3. 药房发药:处方流转、库存扣减

4. 多语言:切换中英文、泰文(模拟外籍患者)

5. 服务响应:故意提一个定制需求,看响应速度

结果:

– 功能满足度:进口85%,软佳95%

– 响应速度:进口平均3秒,软佳平均1.2秒

– 多语言:进口只有界面翻译,软佳处方/报告全链路

– 服务响应:进口”记录需求,2周内回复”,软佳”可以实现,2周上线”

进口代表解释:”我们是大厂,流程规范,保证质量。”

软佳小陈说:”我们24年专注医疗,知道门诊需要什么快。”

决策会议,孙主任做了最终汇报:

“我们原来迷信进口,认为’外国的月亮更圆’。但实际用下来,发现:

1. 进口系统水土不服:是为欧美大医院设计的,我们这种二甲门诊,很多功能用不上,而需要的功能(如医保对接、中文模板)反而要折腾。

2. 成本远超预期:买断12万只是开始,5年维护10万,定制按小时收费,一次小修改就要上万。软佳5年0.95万,全包。

3. 服务不在身边:进口通过代理商,响应慢;软佳昆明总部,本地团队,30分钟响应。

4. 本土化深度:软佳有300+医技模板、ICD编码、医保对接、电子病历规范——这都是进口系统需要二次开发的,而我们等不起。

最关键的是,软佳有24年医疗软件经验。它不是通用软件,是专为门诊设计的。

我建议:切换软佳。”

投票结果:9:2 通过。

切换过程用了6周:数据迁移、员工培训、并行试运行。

三个月后,孙主任整理的实际数据:

指标 进口系统时期 软佳系统 变化
门诊平均等待时间 45分钟 32分钟 -29%
医生工作站满意度 65% 88% +23%
系统相关投诉 月均4起 0.5起 -87%
5年总成本 22万(预估) 0.95万 -12.5万
定制需求响应 2-4周 3-7天 快10倍
医保对接稳定度 偶尔异常 100%正常 100%

“现在系统快了,医生不抱怨了,患者满意度也提升了。”孙主任说。

最满意的是财务老李:”0.95万 vs 22万,这12.5万,我们给门诊添了10台新电脑,还给医护人员发了绩效奖金。”

现在,当同行问孙主任”门诊系统选进口还是国产”,他会反问:

“你选的是’品牌’,还是’匹配度’?

“进口系统是为大医院、国际化设计的。我们基层门诊,需要的是贴合国内流程、医保对接、快速响应、高性价比。这些,国产软佳做得更好。

“谁说国产就不好?软佳24年专注医疗,产品力完全不输进口,价格只有1/5,服务更快。

“我们不是’将就’用国产,是’精打细算’选了更适合的。”

回想那个面对两份账单发愁的下午,孙主任感慨:进口不等于适合,国产不等于低质

医疗信息化选型,核心是匹配:

– 匹配机构规模

– 匹配业务流程

– 匹配预算水平

– 匹配服务需求

软佳证明了:国产门诊系统,可以又好又便宜。

声明:本文基于真实客户案例改编,机构名称、人物均为化名,数据为试点统计,实际效果因机构规模、实施质量、人员配合度而异。产品功能与价格截至2026年5月,请以实际试用为准。

核心金句:

“进口不等于适合,国产不等于将就。”

“匹配度,比品牌更重要。”

“24年专注医疗,足以让国产对标进口。”

互动话题:

您在选择门诊系统时,会优先考虑进口还是国产?

如果您体验软佳,最想验证它哪方面能超越进口系统?

您认为国产医疗软件,最大的优势是什么?


立即免费试用门诊系统https://app.kmhis.com/
International Versionhttps://app.kmhis.com/multi/
了解软佳门诊管理系统详情https://www.kmhis.com/outpatient-management-system.html


扫码预约

手机扫码试用患者预约。请勿输入个人真实信息(点击图片可查看原图)

支持8种语言:简体中文、繁体中文、香港中文、English、藏文、泰文、老挝语、越南语


说真的。这类问题我见过太多了。每次看到医院同事为选型头疼。我就想,要是早点有人把这些经验分享出来就好了。毕竟。选择不对。后面全是麻烦。选择对了。省心省力。还能提升整个机构的运行效率。希望这篇能帮到正在纠结的你。

你如果有具体需求。也可以去 www.kmhis.com 看看。那里有更详细的技术方案和案例。

除夕夜,我们升级了XX医院的HIS系统

“今年除夕,你们必须完成HIS系统从V3.0到V4.0的升级。”

信息科李主任发来这个消息时,老周正在看春节值班表。窗外飘着雪花,办公室里只剩下他一个人。明天就是除夕,大部分同事已经提前请假回家过年了。

老周是昆明软佳的运维负责人,负责XX医院的HIS系统运维。V4.0版本开发了半年,投入了15个开发人员,新功能很多:病历模板云端共享、手术排程智能优化、药品库存预警、移动查房、患者画像、智能分诊…但最关键的,是架构升级——从单体应用变成微服务,理论上更稳定,扩展性更好。

但老周知道,这套系统已经运行了五年,数据量庞大,业务逻辑复杂。数据库里存着三百万患者的完整病历,七年的门诊记录,五年的住院档案,总数据量超过2TB。XX医院是省内最大的三甲医院,日均门诊量一万五千人次,住院病人四千多人,高峰时段并发用户超过2000。任何一点差错,都可能造成医疗事故,甚至引发医疗纠纷,导致医院声誉受损。

“为什么非要除夕?”老周回问。

“因为那天下午后门诊就停了,初二才开诊。”李主任说,”我们有三天窗口期。而且,除夕夜全院最安静,没手术,没急诊高峰,病人少,业务量最低。”

老周沉默了。

说的有道理,但他更知道:除夕夜,工程师们都在家过年,谁愿意加班? 而且,越是”安静”的时候,越容易麻痹大意。平时医院人来人往,任何异常都能及时发现;除夕夜如果出问题,可能到初二上班才暴露,那会已经酿成事故,影响初三的学术会议——院长要在会议上展示新系统,给医院”长脸”。

“能不能预约年初三?”老周问。

“不行,初三有学术会议,院领导和外宾都在。系统要展示新功能,我们要在全同行面前亮相。”

老周明白了:这不是单纯的技术问题,是政治任务,是面子工程。院长要在学术会议上展示HIS系统升级成果,给医院加分,给信息科长脸。

2. 升级前的”恐吓式”测试

老周带着团队,先做了一件事:模拟灾难

他们在测试环境,把V4.0版本部署上去,然后人为制造各种故障场景,看系统能否扛住。

测试环境的数据量是生产环境的10%(200GB),但架构完全一致。

场景一:数据库突然断电

模拟数据库服务器宕机,看应用能否优雅降级。结果:所有功能全部不可用,微服务全部报错。因为所有服务都依赖数据库,而数据库挂了后,服务注册中心(Nacos)也挂了(它也依赖数据库),微服务之间互相找不到,整个系统雪崩。

场景二:网络突然中断

拔掉其中一台应用服务器的网线。结果:那台服务器上的所有请求失败,但没有自动迁移到其他服务器。负载均衡器虽然检测到服务器不可用,但需要30秒才能剔除,这期间用户请求都会失败,体验极差。

场景三:某个微服务突然崩溃

手动kill掉”医嘱管理”服务。结果:所有依赖这个服务的上游功能(如病历书写、护理记录、检查申请)全部报错。熔断器(Hystrix)配置了,但阈值设得太高——需要100次错误才触发,而在这之前,上游已经堆积了大量错误,线程池被打满。

场景四:磁盘突然写满

模拟日志磁盘爆满。结果:系统开始抛出大量IOException,但错误没有统一处理,用户看到的是”系统异常”,而不是”服务器繁忙,请稍后重试”。没有降级策略。

场景五:GC停顿

模拟Full GC,暂停30秒。结果:所有请求超时,用户感觉”卡住了”。

老周的头大了。

这些都不是V3.0时代会遇到的问题——V3.0是单体应用,数据库不挂,系统就不挂。现在V4.0拆成十几个微服务,一个环节出问题,可能影响一片功能。微服务的复杂性,远超预期

3. 我们制定了三套”保底方案”

老周给李主任打了个电话:”直接升级风险太大。我建议分三步走,每一步都有回退方案,确保业务绝对不中断。”

第一步:增量上线,不是全量切换

– 先在门诊药房试点,只对药房人员开放新系统,其他科室继续用旧系统

– 试点稳定三天后,再扩大范围到门诊收费、住院收费

– 最后全员上线

“这样可以控制风险范围,即使药房出问题,也只是局部影响,不影响整个医院。”

第二步:数据双写,随时能回退

– 春节期间,新旧系统并行运行

– 所有新业务数据,同时写入新旧两个数据库

– 如果新系统出问题,一秒回退到旧系统,数据不丢

“数据一致性怎么保证?”李主任问。

“我们在应用层做双写,用一个事务同时写两个库。如果其中一个写失败,整个事务回滚。而且我们会做定时对账(每半小时一次),发现不一致立即修复。双写最多保持一周,等新系统稳定了,就切换单写。”

第三步:除夕不升级,只做”预演”

– 除夕当天,我们不碰生产环境

– 在测试环境,完整演练一遍升级流程和回滚流程

– 如果演练顺利,年初二晚上做真实升级

“为什么不在除夕升级?”

“因为除夕全员都在家,万一出事,人手不足。年初二大家已经收假,可以应对突发情况。”

李主任沉默了很久,思考这个方案的利弊。

“如果年初二升级失败,初三学术会议展示什么?”

“展示我们之前双写的旧系统数据。新系统没上线,但升级计划已经在执行中,可以汇报进度,说明我们在扎实推进。”老周说。

李主任终于同意了:”行,就按你说的来。但年初二必须成功,不然院长会发飙,我们大家都不好过。”

4. 那个熬了三天的夜晚

年初二晚上八点,升级正式开始。

老周团队八个人,加上信息科三个人,全部在现场。机房温度有点低,但每个人都精神高度紧张,手里拿着对讲机,随时沟通。

升级步骤详细到分钟,印在每个人的手里:

1. 数据库备份(预计30分钟):全量备份 + 校验和比对

2. 部署V4.0新服务(预计60分钟):13个微服务逐个启动、初始化、健康检查

3. 数据迁移(历史数据从旧表结构迁移到新表结构,预计120分钟):涉及2176张表,2.3TB数据

4. 配置切换(DNS、负载均衡切到新服务,预计15分钟)

5. 功能验证(各科室核心功能验证,预计60分钟):挂号、收费、住院登记、医嘱、药房…

计划总时长:285分钟,也就是四个半小时。

看起来时间很充裕。

但老周知道,计划赶不上变化。他们准备了”升级失败回滚预案”,如果任何一步出问题,60分钟内必须回滚,否则数据不一致,回滚会更麻烦。回滚本身也需要时间。

第一步:数据库备份。顺利。

虽然备份速度比预期慢10%(用了45分钟),因为数据量比预想大20%,但还是在计划内完成,并校验了checksum,无错误。

第二步:部署V4.0新服务。顺利但有波折。

微服务启动时,有2个服务启动失败:配置管理服务(config-server)因为端口6380被占用(旧系统有个监控进程),注册中心(nacos)因为数据库连接字符串写错了(少了个分号)。修改后重试,总共花了75分钟,比计划多15分钟。

第三步:数据迁移——这是最关键的一步,也是风险最大的。

历史数据有七年的门诊数据、五年的住院数据, Tablespace 超过 2TB。迁移工具data-migrator是公司自己开发的Java程序,还没在这么大的数据集上验证过。

“开始迁移。”

进度条:0.1%…0.2%…

时间一分一秒过去,大家都盯着屏幕,不敢说话。

一百分钟后,进度条卡在37%。

“停一下。”老周心里一紧。

运维工程师小王脸色很难看:”迁移速度变慢了,从每分钟1%降到每分钟0.1%。可能遇到数据热点,或者某张表有锁,或者磁盘IO达到瓶颈。”

“什么表?”

“医嘱表,数据量最大的表,四亿多条记录,占总数据量的60%。现在卡在这一步,因为医嘱表有外键约束,其他表都在等它完成。”

老周拳头捏紧了,指甲嵌进肉里。

37%的数据已经迁过去了,如果中断,回滚要删除这些数据,很麻烦;如果不回滚,继续迁,但速度这么慢(0.1%/分钟,意味着还需要6天),到天亮也迁不完,初二肯定上不了线。

“能不能跳过医嘱表,先迁其他表?”

“不行,医嘱表被其他几十个表外键约束。如果医嘱表没迁移成功,其他表迁了也联不起来,数据是断的,对账都对不上。”

会议室里,气氛凝重。已经凌晨一点,窗外偶尔传来鞭炮声——有人在提前过年。

已经是凌晨一点。

老周看向大家,眼神坚定:”还有什么想法?不论多大胆,说出来。”

5. 最后的办法:物理复制

小王,这个26岁的年轻工程师,说了一个大胆的想法:”我们不做逻辑迁移了,用物理复制。”

“什么意思?”

“我们不通过工具逐条迁移数据,而是直接把旧数据库的 MDF/LDF 文件拷贝到新数据库服务器,在新库上直接做 schema 转换。”

这相当于把旧数据库的”硬盘”直接物理搬到新数据库,然后在新数据库上修改表结构,适应V4.0的 schema。

因为只是修改表结构(加字段、改索引),不移动数据行,速度会快很多——复制2.3TB文件,通过内网万兆光纤,只需要30分钟;schema转换再花1小时。总共2小时搞定。

但风险是:

– 物理复制过程中,如果旧库还有数据写入(虽然升级期间已经通知停业务,但万一有漏网的终端还在连接),数据会不一致。

– 新旧数据库的字符集、排序规则必须完全一致,否则会乱码。

– 复制后需要重新统计信息,否则查询性能会下降,相当于”数据迁移了,但查询更慢了”。

“赌一把。”老周说。现在没有其他选择,时间不等人。

他们先命令所有终端停止连接数据库,确保业务完全停止——这一点至关重要,确保了物理复制的ACID。

然后,停止旧数据库服务,用Robocopy工具拷贝数据文件,保留所有权限和属性。

拷贝花了20分钟(2.3TB通过内网万兆,速度比预想快)。

接着,在新数据库上运行 schema 转换脚本,把旧表结构改造成新表结构。这个过程要极其小心:不能丢失数据,要处理字段类型变化(如VARCHAR长度变化)、新增字段默认值、索引重建…

30分钟搞定。

接着,启动新数据库,验证数据一致性。

比对脚本跑了一个小时,结果是:一致性 99.99%,有少量数据不一致(约0.01%,约230万条记录中的23条),但都是升级期间产生的”残留”数据(停业务后最后几分钟的操作,有的写一半,有的锁未释放),我们可以从binlog里补回来。

老周看了看表:凌晨三点四十分。

“继续!”他的声音沙哑,但坚定。

6. 天亮前的最后一道坎

数据迁移完成,已经是早上六点,天蒙蒙亮。

下面就是配置切换, cutover 到新系统。

但就在这时,医务科刘主任打来电话,语气焦急:”有几个科室反映,他们电脑登录新系统特别慢,要半分多钟。医生在急着开医嘱,病人等在排队,护士站骂人了。”

老周心里一沉。

“是不是网络问题?”

“不是网络,是新系统启动后,有些服务初始化慢。特别是’患者基本信息查询’这个服务, cold start 要一分钟。很多医生在开机后第一次查询,要等很久,他们没耐心。”

老周突然想到:”我们不是有双写吗?让这些科室的人先用旧系统,我们调优新系统。”

但问题是,有些功能V4.0才有,旧系统用不了,医生会抱怨新功能不能用。

“能不能手动调整那些慢服务的超时时间,先让他们能登录?”

小王试了一下,调整了JVM堆内存(从2G加到4G)和线程池参数(从50加到100),登录时间从50秒降到了15秒。

“先这样,赶不上初一,初二能上线就不错了。”老周安慰自己,但心里知道,用户体验不能一直这样凑合。

7. 大年初二,系统上线了

上午十点,老周带着运维团队,在医院信息科”坐镇”。

李主任也在,脸色紧张。他身后站着医务科、护理部、财务科的人,都在等消息。

各科室开始有人陆续上班,系统正式开放使用。

第一个问题是在十点二十分钟出现的:收费处小张打不开收费界面,提示”服务不可用”。

运维立即排查:是”收费服务”这个微服务挂了,因为内存溢出(OOM),JVM heap 满了。

分析堆 dump,发现是某个收费记录的数据量异常大(超过10万条明细),导致内存泄漏。

临时方案:重启服务,并设置单笔交易明细上限为1000条,超过则提示”数据过多,请分批处理”。

十一点,药房反映,药品库存数量不对,有些药显示有库存,实际药架上没药。

查日志:数据迁移时,有一批药房的库存流水没迁全——因为那条记录的状态字段是NULL,迁移脚本跳过了NULL值。

紧急从旧库补数据,手动执行SQL,花了20分钟。

十二点,住院处反映,有病人出院结算时,总金额多了一块二毛钱。

查对账系统:有一笔三毛钱的二维码支付手续费,V3.0没算进总金额,V4.0算了(新功能自动计算)。

热修复:在结算时,如果金额与旧系统差异<1元,自动以旧系统为准。

下午三点,所有问题基本解决,系统运行平稳。

老周给李主任发了消息:”系统基本稳定,可以对外宣称升级完成了。”

李主任回复:”好。但学术会议还有半小时开始,院长要展示新功能,你们那边准备好了吗?”

老周深吸一口气,在微信群里发了消息:”所有工程师,保持手机畅通,随时待命。系统暂时稳定,但别掉以轻心。”

8. 为什么升级总是这么惊险?

升级完成后第三天,老周写了长篇复盘报告,发给公司管理层和XX医院信息科。

他发现,这次升级之所以这么惊险,不是因为技术难度大,而是因为:

1. 想一次性完成:没有采用渐进式上线,而是”一夜切换”。如果分阶段(先药房、再收费、后住院),问题可以早发现早解决,不会最后搞”大杂烩”。

2. 数据迁移工具没经过大数据验证:37%的迁移速度就已经暴露出性能问题,说明工具在TB级数据上表现不佳,应该用更成熟的方案(如物理复制)。

3. 冷启动问题没预判到:新服务启动慢,影响用户体验,特别是首次查询。应该有预热机制(提前启动,加载缓存)。

4. 测试环境数据量不到生产环境十分之一:所以没遇到真实场景的性能瓶颈和脏数据问题。测试应该用生产数据的脱敏副本。

5. 应急预案不够细:虽然准备了回滚方案,但执行时发现很多细节没考虑到(如回滚后的数据一致性验证)。

改进措施(老周在报告中详细列出):

1. 未来升级,必须先灰度发布,小范围验证(如先上10%流量,观察24小时)

2. 数据迁移工具,必须在与生产环境同量级的数据集上测试(至少1TB),并准备物理复制作为备选方案

3. 服务预热机制:在切换前2小时,提前启动新服务,完成JIT编译和缓存预热

4. 升级期间,必须有物理备份,随时能回滚到上一秒状态

5. 建立”升级检查清单”,逐项打勾,不跳过任何步骤

6. 每个微服务都要有熔断、降级、超时配置,不能依赖”默认值”

7. 升级窗口期要预留buffer,计划6小时的任务,给10小时

9. 事后,李主任说了一句话

一周后,李主任请老周吃饭,地点在医院食堂的小包间,没叫外人。

“这次升级,虽然出了不少问题,但总体是成功的。”李主任说,”最重要的是,我们没有因为升级导致病人看病受阻。初三学术会议,院长展示了新系统,效果很好。院长说:’你们的信息科,能打硬仗。'”

老周松了口气。

“但我有个问题,”李主任又说,露出苦笑,”下次升级,能不能别选春节?我们科的人也要过年,连续三天熬夜,身体受不了。”

老周笑了:”下次,我建议选五一或十一,窗口期更长,我们也有更多时间做灰度验证,不用赶工期。”

李主任点头:”这个提议,下次班子会我会提。顺便,你们那套’双写+对账’方案,效果不错,数据零丢失。我们想把它固化下来,以后日常也跑,作为实时备份。”

“可以,我们会写成功能模块,纳入标准产品。”

10. 稳定压倒一切

老周后来在部门内部分享会上,反复强调,把这起事件作为反面教材成长案例

“系统升级最大的风险,不是技术问题,是时间压力

时间一紧,人就容易慌,容易漏步骤,容易不走检查清单。

但系统升级,最怕的就是’赶’。

宁可慢一点,稳一点,分阶段上,也不要一次性能完成但风险不可控。

稳定压倒一切。业务连续性,比面子、比会议、比展示,都重要得多。

这次除夕升级,教训是深刻的。我们学到了:

不要相信’理论上’,一定要测试验证,尤其是灾难恢复测试

不要跳过检查清单,每一步都要有记录、有责任人、有回滚方案

要有回滚预案,而且回滚方案本身也要测试过

时间缓冲要给足,计划再乘以1.5的系数

升级不是IT部门的事,是全院的事,业务部门要参与演练

工程是严谨的科学,不是冲刺。冲刺得来的成功,往往是隐患的开始。”

互动话题

你经历过最惊险的一次系统升级是什么情况?有什么经验教训?

> 基于真实医院场景改编,人物均为化名


立即免费试用门诊系统https://app.kmhis.com/
International Versionhttps://app.kmhis.com/multi/
了解软佳门诊管理系统详情https://www.kmhis.com/outpatient-management-system.html


扫码预约

手机扫码试用患者预约。请勿输入个人真实信息(点击图片可查看原图)

支持8种语言:简体中文、繁体中文、香港中文、English、藏文、泰文、老挝语、越南语


说真的。这类问题我见过太多了。每次看到医院同事为选型头疼。我就想,要是早点有人把这些经验分享出来就好了。毕竟。选择不对。后面全是麻烦。选择对了。省心省力。还能提升整个机构的运行效率。希望这篇能帮到正在纠结的你。

你如果有具体需求。也可以去 www.kmhis.com 看看。那里有更详细的技术方案和案例。