我可以访问一家大型健康保险公司的医疗索赔数据。你们中的一些人可能知道,药物 X 的价格之间存在很大的差异,具体取决于给药地点。
我的公司希望帮助会员减少他们支付的免赔额、共同支付和共同保险的成本,并通过确定最低的护理成本(通常是家庭输液或医生管理)来降低健康游戏的成本。
我正在研究各种方法,客户细分建模似乎是解决此类问题的最佳方法。
索赔数据可以追溯到 3 年前,并且是会员级别的。对于每个成员声明,数据库中可能有许多记录。一条线可以用于 2 小时的化疗,另一条线用于提供的药物,其他用于护士的时间,等等。每一行指定护理地点的位置,即家庭输液、医生、门诊、专业药房。每个索赔还提供有关主要诊断的详细信息,即类风湿性关节炎 (RA) 等。
理想情况下,当有更便宜的替代方案可用时,我想找出那些使用昂贵护理站点的成员。例如,我在想,对于 RA 的初步诊断,我可以使用诊断代码过滤到 RA 成员,然后根据某些输入特征(例如人口统计、到家庭输液中心/医院/医生的距离、覆盖级别)对这些成员进行聚类,补充频率、剂量、药物成本、当前服务地点等。
我的方法是正确的,还是有比聚类更好的方法来解决这个问题?