药品模型讨论

从某部门获取的药品目录数据的结构如下所示:

字段名称

示例数据

ID50270
ypid10.010102023020Y
国家医保药品编码XG03GAR036B014030100453
药品本位码86900453000704
产品名称注射用头孢他啶
标化产品名称壮腰健肾丸
商品名艾地罗
上市许可持有人Chugai Pharmaceutical Co.,Ltd
生产企业名称北京太洋药业股份有限公司
生产企业编码Q03191
代理企业名称丽珠集团丽珠制药厂
代理企业编号S00021
统一社会信用代码91440400617489061P
企业类别合资
批准文号国药准字H20044308
药品类别生物制剂
药品类别代码1
药理/功效分类垂体激素及下丘脑释放激素药
药理/功效分类码0102
通用名(中文)人血白蛋白
通用名(英文)Chorionic Gonadotrophin
通用名代码023
酸根盐基不成盐
酸根盐基分类码00
剂型分类名称注射用无菌粉末
剂型分类码2602
规格10g(20%*50ml)
规格标化12.5g 250ml
含量0.75
含量单位mg
附加规格100ml:胞磷胆碱钠0.5g与氯化钠0.9g
制剂规格分类码701T
包装规格直立式聚丙烯输液袋
转换系数12
转换系数码001
包装材质低硼硅玻璃管制注射剂瓶
最小包装单位
最小制剂单位
差异备注剂型:粉针剂|材质:预充式
差异备注码01
基药2018版
基药2018版类别十二、激素及影响内分泌药
基药2018版原始目录药品分类(一)下丘脑垂体激素及其类似物
基药2018版通用名绒促性素ChorionicGonadotrophin
基药2018版剂型规格注射用无菌粉末:500单位、1000单位、2000单位、5000单位
基药2018版目录编号367
基药2018版原始目录备注
基药2018目录调入药品WHU
基药2018目录调出药品WHU
医保22版甲乙类
医保22版编号536
医保编号2022版分类西药536
医保22版药品分类促性腺激素和其他促排卵药
医保22版药品分类代码XG03G
医保22版一级分类泌尿生殖系统药和性激素
医保22版二级分类全身用抗菌药
医保22版三级分类促性腺激素和其他促排卵药
医保22版四级分类影响电解质平衡的溶液
医保22版备注限绝经后女性骨质疏松症。
医保21版甲乙类
医保21版编号622
医保编号2021版分类西药622
医保21版药品分类第三代头孢菌素
医保21版药品分类代码XJ01DD
医保21版一级分类全身用抗感染药
医保21版二级分类全身用抗菌药
医保21版三级分类其他β-内酰胺类抗菌药
医保21版四级分类第三代头孢菌素
医保21版备注限出现意识障碍的急性颅脑外伤和脑手术后患者,支付不超过14天
医保剂型注射剂
国家短缺药品1/2
国家组织药品集中采购品种第八批供应
通过一致性评价药品1/3
国家重点监控合理用药药品目录2
鼓励仿制药目录1
鼓励研发申报儿童药品建议清单1
进口专利药1
专利持有人阿斯利康
批准上市的中国I类新药1
中国I类新药批准时间2001年
低价药1
免关税药品1
罕见病药品降价专项工作药品1
麻醉药品1
精神一类药品1
精神二类药品1
妇产科用药1
儿科用药1
急抢救用药2
国家谈判药品3-新增乙类-结直肠癌
定点生产药品1
ATC大类码G
ATC大类全身用抗感染药物
原生产企业名称上海新亚药业有限公司
原企业编码Q04416
原批准文号国药准字S20033384
批准文号开始日期2002-10-16
批准文号注销日期2018-02-03
YPID9_0114010100208
YPID8_010102023020Y
YPID7_010102023020Y
YPID6_010102023020Y
YPID5_410102023020Y
YPID4010102023020Y
YPID3010102023020Y
作废YPID的比对关系10101014010U,10101014010N,101010140111,
状态2
儿童用药说明2
过评时间2021/4/16
抗肿瘤药罕见病用药减免税第二批罕见病药品制剂
中成药集采1
罕见病用药1
给药途径大类注射
给药途径小类注射
生产地址北京市朝阳区双桥东路乙1号
生产地址区划110105
通用名拼音Tou Bao Ta Ding
出版用规格50ml∶10g 

一共有118个属性,包括了药品的品种信息、规格信息、各个版本的医保信息等。目前有几点问题需要讨论明确:

  1. 属性过多,如果全部建立到一个实体模型上似乎是不太合理的;
  2. 是否可以考虑去掉一些对基础资源来说略显多余的信息,比如医保各个版本的分类信息等;
  3. 目录数据总共有254199条,除了数据量外,还有一些属性的值似乎是不正确或者说不规范的,需要考虑设置一些校验和清理的规则;
  4. 涉及到值域集的属性,如“医保剂型”、“药品类别代码”等,需要获取对应的完整的值域集;
  5. 目前的结构中似乎有一些属性是值域集中的名称和代码成对出现的,如“药品类别”和“药品类别代码”等,在建立了完整的值域集的基础上,可以考虑去掉部分明显是值域集名称的属性;

欢迎大家针对以上几点问题提出意见和建议,或者补充漏掉的其它问题!感谢!