本报告旨在深度剖析皮肤刺激试验在现代化妆品安全评估中的核心地位,系统性地研究了四种主要化妆品类别——洁面/爽肤、乳液/面霜、防晒/隔离及彩妆——的测试策略。报告重点比较了三种主流的皮肤刺激试验方法:人体重复刺激斑贴试验(RIPT/HRIPT)、人体斑贴试验(Patch Test)以及体外3D皮肤模型。此外,本报告对中国国家药品监督管理局(NMPA)、欧盟(CE标志/化妆品法规(EC) No 1223/2009)和美国食品药品监督管理局(FDA)的现行监管要求进行了详尽的合规性分析,旨在为化妆品行业的研发、生产及市场准入提供兼具深度与广度的科学与法规参考。
1. 引言:皮肤安全——化妆品产业的基石
随着全球消费者对化妆品安全意识的日益增强,产品的皮肤相容性已成为品牌赢得市场信赖的先决条件。皮肤刺激反应作为最常见的不良反应之一,其科学、准确的评估是化妆品安全体系的重中之重。企业不仅需要证实产品在正常使用条件下的温和性,还需满足日益严格且差异化的全球市场准入法规。
本研究将聚焦于当前行业内最受关注的三种皮肤刺激试验方法:作为评估累积刺激和致敏性“金标准”的人体重复刺激斑贴试验(RIPT)、广泛用于急性刺激评估的人体斑贴试验(Patch Test),以及在“3R”(替代、减少、优化)原则驱动下迅速发展的体外3D皮肤模型。我们将结合不同产品(洁面/爽肤、乳液/面霜、防晒/隔离、彩妆)的理化特性和使用方式,探讨最佳的测试策略组合,并深入解读中国、欧盟和美国三大核心市场的监管框架与合规路径。

2. 皮肤刺激试验方法深度解析
2.1 人体斑贴试验 (Human Patch Test, HPT)
人体斑贴试验是一种经典、直接的皮肤刺激性评估方法,通过将测试样品施用于人体皮肤特定区域,在规定时间内观察并记录皮肤反应。
- 原理与方法: 该试验旨在评估单次或短期接触化妆品后引发的急性皮肤刺激反应。根据产品特性,试验可分为封闭型斑贴试验和开放型斑贴试验。封闭型试验使用斑贴将样品固定在皮肤上,增强渗透,适用于乳液、面霜等非挥发性产品;而开放型试验则直接将样品涂抹于皮肤,适用于爽肤水、卸妆液等易挥发或使用后需冲洗的产品 。
- 试验流程与评估: 试验流程严谨,包括:
- 受试者筛选: 严格筛选健康、无皮肤病史且符合特定年龄要求的志愿者 。
- 样品施用: 将定量的样品施用于受试者背部或前臂内侧的皮肤上 。
- 观察与评分: 在移除样品后的特定时间点(如24小时、48小时、72小时)由专业皮肤科医生进行观察,并根据国际接触皮炎研究小组(ICDRG)或类似标准对红斑、水肿等皮肤反应进行分级评分(例如,0-4分或0-5分制) 。
- 优缺点分析:
- 优点: 能够直接反映产品对人体的真实刺激反应,结果直观且被各国监管机构广泛接受。
- 缺点: 涉及人体伦理,试验周期相对较长,成本较高,且无法完全排除个体差异对结果的影响。
2.2 人体重复刺激斑贴试验 (Human Repeat Insult Patch Test, RIPT/HRIPT)
RIPT/HRIPT是一种更为复杂的临床试验,不仅评估急性刺激,更侧重于评估产品在长期、重复使用下的累积刺激性和潜在的接触致敏性。
- 原理与方法: 该方法模拟消费者日常重复使用化妆品的场景,通过一个精心设计的周期性施用过程来激发皮肤的潜在不良反应。其经典流程分为三个阶段 :
- 诱导期 (Induction Phase): 在数周内(通常为3周),每周进行多次(如3次)重复的斑贴测试,旨在对免疫系统进行“致敏”。
- 休息期 (Rest Period): 停止所有测试约2周,让皮肤和免疫系统有时间产生并发展记忆反应。
- 激发期 (Challenge Phase): 在休息期后,于一个全新的皮肤部位进行一次单次斑贴,观察是否引发比初次接触更强烈的皮肤反应(即致敏反应)。
- 评估标准: 评估不仅包括每次斑贴后的即时刺激评分,更关键的是对比诱导期和激发期的反应强度差异,以此判断产品是否具有致敏性 。
- 优缺点分析:
- 优点: 是目前评估化妆品致敏潜力的最权威的人体试验方法,能全面反映产品长期使用的安全性,是“低敏”宣称的有力支持 。
- 缺点: 试验周期极长(通常5-6周),成本非常高,对受试者和研究机构的伦理要求极为严格。
2.3 体外3D皮肤模型试验 (In Vitro 3D Skin Model Tests)
随着全球范围内对动物试验的限制和禁止,体外3D皮肤模型已成为化妆品皮肤刺激性测试的重要替代方法。
- 原理与技术: 该技术使用人体来源的角质形成细胞,在体外培养构建出具有多层结构、分化良好且具备屏障功能的重建人类表皮(Reconstructed Human Epidermis, RHE)模型。这些模型(如商业化的EpiSkin™, EpiDerm™, SkinEthic™ RHE, EpiKutis®)在形态学和生物化学上高度模拟人体表皮 。
- 方法学: 目前国际上最广泛接受的标准方法是 经济合作与发展组织(OECD)的测试指南439(TG 439) 。其基本流程为:将测试物施用于RHE模型表面,培养一段时间后,通过MTT法等细胞活力检测手段,测定细胞存活率。细胞存活率低于特定阈值(通常是50%)的样品被判定为具有皮肤刺激性 。
- 优缺点分析:
- 优点: 完全符合动物福利的“3R”原则,试验周期短,可实现高通量筛选,重复性好,避免了人体试验的伦理问题。
- 缺点: 现有模型主要模拟表皮层,缺少真皮层、免疫细胞和毛囊等完整皮肤结构,因此无法评估光毒性、致敏性等需要复杂免疫系统参与的反应。其结果主要用于刺激性预测和分类,而非强度的精确定量。
3. 不同类别化妆品的皮肤刺激试验应用策略
选择何种测试方法取决于产品的剂型、成分、使用方式和目标市场的法规要求。
-
3.1 洁面/爽肤类产品:
- 特点: 作用时间短、即用即洗,主要关注急性、短期刺激。配方中的表面活性剂是主要的潜在刺激源。
- 测试策略: 人体斑贴试验(特别是开放型) 和 体外3D皮肤模型(OECD TG 439) 是理想的评估工具。体外模型可用于早期配方筛选,而人体斑贴试验则可作为最终产品上市前的安全性确认。由于其冲洗型的使用特性,进行完整的RIPT试验可能意义不大或需调整方案 。
-
3.2 乳液/面霜类产品:
- 特点: 长期停留在皮肤上,成分复杂,旨在提供保湿、修复等功效,其累积刺激性和致敏性风险更高。
- 测试策略: RIPT/HRIPT是评估此类产品安全性的黄金标准,尤其对于宣称“敏感肌适用”或面向特殊人群的产品 。在研发早期,可使用体外3D皮肤模型进行原料和配方的初步刺激性筛选,随后通过人体斑贴试验和RIPT进行最终验证。
-
3.3 防晒/隔离类产品:
- 特点: 含有防晒剂(化学或物理),在紫外线照射下使用,因此除了常规刺激外,还需重点评估光刺激和光致敏风险。
- 测试策略: 安全性评估方案最为复杂。RIPT/HRIPT对于评估这类长期、每日使用的产品至关重要,且被美国FDA等监管机构高度重视 。人体斑贴试验是中国法规下的常规要求 。此外,必须结合 体外光毒性试验(如OECD TG 432 3T3 NRU光毒性试验) 和人体光斑贴试验来全面评估其光安全性。
-
3.4 彩妆类产品:
- 特点: 成分中含有色素和粉体,长时间带妆,且部分产品(如眼影、口红)使用于皮肤较薄或黏膜区域。
- 测试策略: 对于面部使用的粉底、腮红等产品,RIPT/HRIPT和人体斑贴试验是核心评估方法。体外3D皮肤模型可有效筛选色素、香精等原料的刺激性。针对眼部、唇部等特殊部位的产品,还需进行相应的眼刺激试验和黏膜刺激试验。
4. 全球主要市场监管合规性分析
4.1 中国国家药品监督管理局 (NMPA)
中国的化妆品监管体系正处于快速发展和完善阶段,对安全性的要求日益严格。
- 法规框架: 主要依据《化妆品监督管理条例》及其配套法规,如《化妆品安全技术规范》(当前有效版本为2015版,但需密切关注更新动态)和《化妆品注册和备案检验工作规范》 。
- 人体试验要求: 人体皮肤斑贴试验是毒理学试验中的一项常规项目,在产品注册和备案中广泛要求。对于特殊化妆品(如防晒、祛斑美白类),如果其动物试验(皮肤刺激性/腐蚀性试验)结果显示有刺激性,法规强制要求需加做人体皮肤斑贴试验进行最终确认 。NMPA已发布《人体皮肤斑贴试验方法(征求意见稿)》,显示出对该方法标准化的高度重视 。
- 判定标准: NMPA有明确的判定标准。例如,《化妆品技术审评指南》规定,在30例受试者的人体斑贴试验中,出现1级(轻微)皮肤不良反应的人数不得超过4例,且不得出现2级及以上反应 。
- 体外模型接受度: NMPA对体外替代方法持积极鼓励态度,并已将其纳入未来的标准制修订计划中,例如“体外重建3D模型试验方法” 。然而,截至2025年底,体外模型数据主要作为辅助性资料,尚不能完全替代法规要求的动物试验或人体试验,尤其是在特殊化妆品注册中。
4.2 欧盟 (EU)
欧盟拥有全球最严格的化妆品监管体系之一,其核心是预防原则和对消费者安全的高度保障。
- 法规框架: 核心法规是《欧盟化妆品法规》(EC) No 1223/2009。该法规要求所有上市产品都必须完成一份详尽的 化妆品安全报告(CPSR) ,由具备资质的安全评估员进行评估 。
- 动物试验禁令: 欧盟已全面禁止为化妆品目的进行动物试验,并禁止销售经过动物试验的化妆品原料和成品。这使得替代方法成为强制性要求 。
- 体外模型接受度: 基于OECD TG 439的体外3D皮肤模型试验是欧盟评估皮肤刺激性的首选和标准方法,其结果被监管机构和安全评估员广泛接受 。欧盟消费者安全科学委员会(SCCS)在其发布的《化妆品成分测试和安全评估指南》(SCCS Notes of Guidance)中,明确支持和指导替代方法的使用 。
- 人体试验应用: 在体外方法无法充分评估某些特定风险(如致敏性)或为了支持特定宣称(如“低过敏性”、“敏感肌肤适用”)时,可以在遵循赫尔辛基宣言等伦理准则的前提下,采用人体斑贴试验或RIPT/HRIPT作为补充证据。这类数据是CPSR中“权重证据法”(Weight of Evidence)评估策略的重要组成部分。
4.3 美国食品药品监督管理局 (FDA)
美国的化妆品监管模式与中国和欧盟有显著不同,采取的是上市后监管为主的策略。
- 法规框架: 依据《联邦食品、药品和化妆品法案》。FDA不要求化妆品(作为OTC药品的防晒霜除外)在上市前进行审批。但是,制造商负有确保其产品安全的全部法律责任 。
- 人体试验接受度: FDA虽然没有强制规定必须进行何种测试,但RIPT/HRIPT被广泛认为是评估产品皮肤刺激和致敏潜力的可靠方法,并被FDA认可 。特别是在评估防晒霜这类OTC药品时,FDA的行业指南明确建议进行包括RIPT在内的皮肤安全性研究 。FDA也曾发布过针对透皮给药制剂的皮肤刺激测试指南,虽非直接针对化妆品,但其科学原则具有重要参考价值 。
- 体外模型接受度: FDA鼓励并支持替代方法的开发和使用,并认可经过科学验证的3D皮肤模型在安全性评估中的价值 。许多企业已常规性地使用符合OECD TG 439的模型数据作为产品安全档案的一部分。然而,FDA尚未发布专门针对化妆品领域的、详述3D模型数据接受标准的官方指导文件。企业需自行确保所用方法的科学有效性。
- 现状总结: 在美国市场,安全性证据的构建更依赖于科学共识和行业最佳实践,而不是僵化的法规清单。目前行业内的一个挑战是缺乏针对大量化妆品产品的统一、标准化的皮肤刺激评估标准 。
5. 综合比较与未来趋势
5.1 方法学与监管环境比较
| 维度 |
人体斑贴试验 (HPT) |
人体重复刺激斑贴试验 (RIPT) |
体外3D皮肤模型 |
| 评估终点 |
急性/短期刺激 |
累积刺激、致敏性 |
急性刺激(细胞毒性) |
| 周期 |
较短 (数天) |
长 (5-6周) |
极短 (1-2天) |
| 成本 |
中等 |
高 |
低 |
| 伦理考量 |
涉及人体 |
涉及人体,要求更高 |
无 |
| 预测能力 |
直接反映人体反应 |
模拟长期使用,预测致敏性 |
筛选/分类刺激物,无法预测致敏 |
| 中国NMPA接受度 |
法规常规要求 |
用于支持性证据/功效宣称 |
鼓励,未来趋势,暂不替代法规方法 |
| 欧盟EU接受度 |
在替代方法不足时作为补充证据 |
在替代方法不足时作为补充/确证证据 |
标准方法 (OECD TG 439) |
| 美国FDA接受度 |
广泛接受的行业实践 |
广泛接受,尤其用于OTC防晒霜 |
鼓励使用,作为科学证据的一部分 |
5.2 未来趋势展望
- 新方法学(NAMs)的崛起: 超越现有的3D皮肤模型,包含免疫细胞的更复杂的皮肤模型、皮肤器官芯片(Skin-on-a-Chip)等技术将提供更精准的体外预测能力,尤其是在致敏性评估方面。
- 整合测试与评估策略(IATA): 未来化妆品安全评估将不再依赖单一测试,而是采用整合策略,结合计算机模拟(in silico)、多种体外测试(in vitro)和有限的人体数据(in vivo/ex vivo),形成一个更高效、更科学、更人道的评估体系。
- 全球法规协调: 随着国际化妆品法规协调会议(ICCR)等组织的努力,全球主要市场对替代方法的接受标准和数据要求有望逐步趋同,降低企业的合规成本。
- 个性化安全评估: 针对敏感性肌肤、不同年龄段、不同人种皮肤特性的安全评估将成为研发热点,推动测试方法向更精细化、个性化的方向发展。
6. 结论
皮肤刺激试验是确保化妆品安全的关键环节。人体斑贴试验、RIPT和体外3D皮肤模型各有其独特的优势和局限性,在化妆品研发和评估的不同阶段扮演着不可或缺的角色。企业必须基于产品的具体特性(如剂型、成分、使用方式)和功效宣称,科学地选择单一或组合的测试策略。
从全球监管格局来看,三大主要市场呈现出鲜明的特点:欧盟以“替代优先”为原则,强制推行体外方法;美国奉行“企业负责”的原则,依赖科学证据和行业共识;而中国则在“强化监管”的道路上,正逐步与国际先进的替代方法接轨。
面对未来,化妆品企业必须建立一个动态、灵活的安全评估体系,不仅要满足当前目标市场的法规要求,更要前瞻性地布局和采纳新方法学(NAMs)和整合测试策略(IATA)。唯有如此,才能在全球化竞争中,既保证消费者的安全,又保持产品的创新活力与市场竞争力。