消费者颜色偏好与数据分析方法研究:实验比较与 Monte Carlo 模拟
1. Analysis of Research Strategies to Determine
1.1 论文中的数据分析内容
- 四种实验方法的比较
- N-Alternative Forced Choice (N-AFC):让参与者在同时呈现的多种颜色中选择最喜欢的一种。
- Rank-Order:要求参与者把所有颜色从最喜欢到最不喜欢排序。
- Rating:给每个颜色打分,比如 0%-100% 表示不喜欢到最喜欢。
- Paired Comparison:两两颜色比较,每次选一个更喜欢的,最后得到整体排序。
- 数据转换与标准化处理
- 把不同方法的原始结果(选择次数、排序、打分、配对比较结果)转化为统一的 比例值 (0%–100%)。
- 再通过 Thurstone’s Law of Comparative Judgement(案例V) 转换成 区间尺度 z 分数,使不同方法的数据可以比较。
- 统计分析与结果
- 比较四种方法得出的偏好顺序:多数情况下结果一致(橙色最受欢迎,绿色最不受欢迎)。
- 使用 相关系数 (r²) 来衡量不同方法之间的一致性,以及样本量大小对稳定性的影响。
- Monte Carlo 模拟分析
- 从 41 个样本中反复随机抽取不同数量的子样本(比如 n=36, 31, 26…直到 n=1)。
- 每次计算颜色偏好顺序与完整样本的相关性(r²)。
- 发现:当样本量小于 11 时,Rating、Rank-Order、Paired Comparison 更稳定;而 N-AFC 方法波动大。
1.1.1 Monte Carlo 模拟分析
我们不仅仅要知道老师论文涉及的知识、技术,更要了解老师的意图,为什么要使用某个技术?别的技术不行?
多思考,多实践。
基本定义:Monte Carlo 模拟是一种基于随机数和概率统计的计算方法。
核心思想:用大量随机样本来模拟和逼近复杂问题的可能结果,从而得到一个概率分布而不是单一的确定结果。
简单说,就是“用随机数去模拟各种可能发生的情况,看大规模模拟之后的整体趋势”。
为什么需要 Monte Carlo 模拟?
- 很多现实问题(金融风险、项目工期、物理实验、排队模型等)太复杂,无法直接用数学公式精确解出结果。
- 比如:
- 股票价格未来 1 年的波动?
- 一个建筑项目完工的时间?
- 投资组合的风险收益?
- 这些问题都存在不确定性,Monte Carlo 就是用随机模拟去近似求解。
1.2 涉及的数据分析原理解释
比例数据 (Proportion Data)
- 将原始数据转化为百分比,方便不同方法之间比较。
- 例如:如果 100 个人中有 40 人最喜欢蓝色,那么蓝色的偏好比例就是 40%。
区间尺度转化 (Interval Scaling, z-score)
- 使用统计学方法(如 标准正态分布反函数)将比例值转化为 z 分数,消除了比例在极端(0% 或 100%)的限制,使数据能进行线性比较。
相关系数 r² (Coefficient of Determination)
- 衡量不同实验方法结果与总体结果的一致性。
- r²=1 表示完全一致,r² 越低说明差异越大。
Monte Carlo 模拟
- 一种随机抽样重复试验的方法。
- 用来评估在不同样本规模下,实验方法的结果是否稳定。
- 通过多次模拟得到一个概率分布,而不是依赖单次实验结果。
分析原理(步骤):
Monte Carlo 模拟通常包含以下流程:
确定输入变量及其概率分布:(例如:股票年回报率符合正态分布(均值 8%,标准差 15%))
随机抽样:根据定义的分布,利用计算机生成大量随机数(成千上万次)
计算模型结果:将每次抽样代入模型公式,计算出对应的结果。
统计与分析:
- 把所有模拟结果汇总,形成结果的概率分布。
- 从中可以得到:平均值、中位数、标准差、置信区间、最坏/最好情况概率等。
举例(现实生活场景):
🎲 例子 1:掷骰子
- 我想知道连续掷两个骰子,总和大于 8 的概率。
- 可以写出数学公式直接算,但 Monte Carlo 模拟是另一种方法:
- 模拟掷 100 万次骰子(随机生成 1~6 的点数)。
- 统计有多少次结果大于 8。
- 用次数/总次数 ≈ 概率。
- 结果会接近真实概率(≈ 0.278)。
💰 例子 2:投资收益
- 假设你买了一个基金,年化收益率平均 8%,但波动(标准差)15%。
- 用 Monte Carlo:
- 在未来 10 年里,每年随机抽取一个“收益率”来模拟基金表现。
- 重复 1 万次,得到 1 万条“基金 10 年后的价值曲线”。
- 汇总结果 → 可以看到 10 年后资产的 分布:
- 70% 的概率资产翻倍;
- 10% 的概率资产亏损;
- 最坏 1% 的情况甚至腰斩。
这样比“单纯说平均收益 8%”更有参考价值,因为它揭示了风险区间。
1.3 生活中的例子帮助理解
- N-AFC(多选一)
类似于点菜时,服务员把菜单上 6 道菜都端到你面前,让你直接选出“最想吃的那一道”。- 问题:如果参与者人数少,可能因为偶然选择导致结果偏差大。
- Rank-Order(排序)
就像你写“最喜欢的手机品牌排行榜”,把苹果、华为、三星、小米等从最喜欢到最不喜欢依次排列。- 优点:即使人数少,也能比较稳定地反映整体趋势。
- Rating(打分)
类似于电影评分(豆瓣 1–10 分制),每个人对每部电影都给分,最后算平均值。- 优点:能反映偏好强度(喜欢很多 vs 稍微喜欢)。
- Paired Comparison(两两比较)
像世界杯点球大战,每次两支球队对比,选一个胜出,最后得出冠军。- 缺点:如果参赛者太多,两两比较会非常耗时。
- Monte Carlo 模拟
就像你想知道“抛硬币 10 次正反面分布”是不是稳定。你会模拟成千上万次,每次都随机抛 10 次,然后统计结果,最终得到一个分布。- 在论文中,作者用它来测试“如果只收集到 6 个人的数据,结果还可信吗?”
1.4 数据转换
1.4.1 为什么要转换数据?
论文里有四种实验方法:
AFC(多选一) → 得到的是 “次数”;
Rank-Order(排序法) → 得到的是 “名次”;
Rating(打分法) → 得到的是 “分数”;
Paired Comparison(两两比较) → 得到的是 “胜出次数”;
问题来了:
- 次数、名次、分数、胜出次数,本质上不是同一种量纲,没法直接比较。
- 举个例子:一个人说“蓝色是第一名”,另一个人说“蓝色打 80 分”,这两种数据如果直接放在一起,没有可比性。
👉 所以,需要把它们 转化到同一个标准化的区间(0% ~ 100%),然后再进一步转化成 可以比较的数值(z 分数)。
1.4.2 第一步:转化为比例 (0% – 100%)
就是把各种形式的回答,统一换算成一个比例值。
- AFC(多选一):如果 100 个人里有 40 人最喜欢蓝色 → 蓝色偏好率 = 40%
- Rank-Order(排序):假设 5 个人对蓝色排序分别是 1, 2, 3, 2, 1(分别代表蓝色的位置) → 平均名次 = 1.8 → 再转化为比例(例如计算成“蓝色有 70% 的人把它放在前三名”)。
- Rating(打分):每个人对蓝色打分:70%、80%、90%、60% → 平均值 = 75%
- Paired Comparison(两两比较):蓝色 vs 红色,10 次比较中蓝色赢 7 次 → 蓝色胜率 = 70%
这样,所有方法最后都可以变成类似:
蓝色:75%
橙色:65%
绿色:20%
……1.4.3 第二步:转化为区间尺度 z 分数
虽然比例已经能看了,但有一个问题:
- 当比例接近 0% 或 100% 时,它的变化空间很小,不利于统计比较。
- 比如从 90% 到 95%,看起来差了 5%,但实际差距可能比 40% 到 45% 要大得多。
👉 这时,就需要用到 Thurstone’s Law of Comparative Judgement(色彩心理学里常用),把比例转成 z 分数。
什么是 z 分数?
- 它来自标准正态分布。
- 把比例(p 值)代入正态分布的反函数,就能得到一个对称的数值。
- 中间(50%)对应 z=0,越偏向两端(0% 或 100%),z 的绝对值越大。
例子:
- 50% → z = 0 (中性)
- 84% → z = +1 (比平均好 1 个标准差)
- 16% → z = –1 (比平均差 1 个标准差)
这样,就能把所有颜色的偏好值都映射到一个 连续的、可比的数轴上。
1.4.4 实际生活类比
投票选美比赛
有的人只告诉你“谁第一名”;
有的人给每个人打分(90分、80分…);
有的人只做一轮一轮 PK。
→ 这些原始结果格式都不一样,没法直接说“谁最漂亮”。
→ 所以先要转成“百分比(多少人支持)”,再进一步变成一个统一的“标准化分数(z 分数)”。
考试成绩转 GPA
有的学校用百分制(85 分),
有的用等级制(A, B, C),
有的用 5 星制。
→ 统一换算成 GPA(比如 A=4.0,85分≈3.7),才能放在一起比较学生成绩。
这里 GPA 就相当于论文里的 “z 分数”。
外卖评分
有人说“好吃”,有人打 5 星,有人给 9 分。
平台为了排序,需要把它们转化为同一标准(比如 0–100 的分数,再标准化)。
1.5 总结
这篇论文的核心数据分析思路是:
- 先把不同实验方法的数据转化为统一的区间尺度;
- 再通过 相关系数 和 Monte Carlo 模拟 检验方法的稳定性;
- 结论是:当参与人数较少时,Rating、Rank-Order、Paired Comparison 更适合,而 N-AFC 容易不稳定。
2. CRA_Yu_Westland_Li_Pan_Shin_Won
2.1 论文中的数据分析内容提炼
- 研究对象与实验设计
- 共选择了 54 种日常家居产品(如牙刷、咖啡机、洗发水、拖鞋等)。
- 每个产品被设计成 六种颜色版本(红、橙、黄、绿、蓝、紫)。
- 实验分为 两种形式:
- 线上实验:173 名参与者,选择他们愿意购买的颜色。
- 实验室实验:39 名参与者,除选择颜色外,还评估颜色与产品功能/性能的关系(用 5 点李克特量表,转化为 0–100% 分值)。
- 关键数据指标
- 颜色一致率(Colour Consistency Rate)
- 定义:参与者是否选择了与自己“最喜欢颜色”一致的产品颜色。
- 计算方式:某产品选择与个人最喜欢颜色一致的比例。
- 随机情况下理论值为 17%(因为 6 种颜色)。
- 实验结果:
- 在线实验平均一致率:34.2%
- 实验室实验平均一致率:30.1%
👉 说明个人颜色偏好确实影响购买决策。
- 功能/性能相关性评分
- 例如:参与者评估“颜色是否影响该产品性能/功能”。
- 结果:
- 高相关性:漱口水 (66.7%)、洗洁精 (57.1%)、沐浴露 (56.4%)。
- 低相关性:剪刀 (13.5%)、开瓶器 (16%)、椅子 (16.7%)。
- 相关性分析
- 研究者计算了 颜色一致率与功能/性能相关性之间的相关性:
- 在线实验:R² = 0.41
- 实验室实验:R² = 0.64
👉 越是“颜色强烈暗示功能”的产品,个人颜色喜好影响越小。
- 研究者计算了 颜色一致率与功能/性能相关性之间的相关性:
- 颜色一致率(Colour Consistency Rate)
2.2 涉及的数据分析原理
- 对照基准 (Baseline Comparison)
- 设定 随机选择下的理论概率 17%,作为基准。
- 如果实验结果明显高于 17%,说明个人颜色偏好对购买决策有显著影响。
👉 这是典型的 假设检验思路:和“无效假设”(随机选择) 对比。
- 相关性分析 (Correlation Analysis)
- 使用 R²(决定系数) 衡量颜色一致率与功能/性能评分之间的关系。
- R² 越高,说明产品的“功能相关性”越能解释颜色偏好的作用强弱。
👉 这是 回归分析/相关性分析 的应用。
- 分类比较 (Group Comparison)
- 研究对比了不同产品、不同颜色、不同实验条件(线上 vs 实验室)的差异。
👉 属于 多维度数据分析,常用于消费者研究。
- 研究对比了不同产品、不同颜色、不同实验条件(线上 vs 实验室)的差异。
2.3 生活中的实际例子
- 漱口水的颜色选择
- 大多数人觉得蓝色漱口水“更干净、杀菌力强”,绿色漱口水可能让人联想到“苹果味”或“天然”。
- 即使你最喜欢的颜色是紫色,你可能也不会买紫色的漱口水。
👉 功能相关性强,个人偏好影响弱。
- 牙刷的颜色选择
- 功能上,红色和蓝色牙刷没什么差别。
- 在这种情况下,人们更容易选择自己喜欢的颜色。
👉 功能相关性弱,个人偏好影响强。
- 家电的颜色选择
- 烤箱、咖啡机等加热产品,很多消费者倾向选择红色或黑色,因为联想到“热、稳重、耐用”。
- 而苹果 iPod Nano 则可以推出彩色系列,消费者愿意根据喜好挑选。
👉 部分产品靠颜色“功能暗示”,部分产品依赖“个人偏好驱动”。
2.4 总结
论文中的数据分析核心是:
- 通过 颜色一致率 测量个人喜好对购买行为的影响;
- 通过 相关性分析 验证“功能/性能相关性”与个人喜好作用的关系;
- 得出结论:
- 当颜色与产品功能/性能强相关时,个人偏好作用弱(如漱口水、洗洁精);
- 当颜色与功能无关时,个人偏好作用强(如牙刷、椅子)。
换句话说,颜色的营销价值,要看产品类型:
- 日常消耗品:颜色→功能暗示更重要。
- 个性化产品:颜色→个人偏好更重要。
3. Proceeding_official (dragged)2
3.1 论文中的数据分析方法
- 实验设计与数据采集
- 研究对象:60 块彩色织物样本(20 种颜色 × 3 种材质:棉、麻、丝)。
- 测试人群:80 名受试者(男女各 40,18-35 岁,具备色彩科学训练)。
- 实验方式:心理物理学实验,参与者在标准光源 D65 下观看并触摸样本。
- 评价指标:使用 7 点 Likert量表(从“冷-暖”、“薄-厚”、“男性化-女性化”、“不愉快-愉快”等八个维度进行打分)。
- 数据表示与处理
- 每块织物的颜色用 CIELAB 色彩空间(L*, a*, b*)进行量化。
L*= 明度(亮暗)a*= 红-绿通道b*= 黄-蓝通道
- 数据处理:将主观评价量表分数转化为区间数据进行统计分析。
- 每块织物的颜色用 CIELAB 色彩空间(L*, a*, b*)进行量化。
- 统计分析方法
- 配对 t 检验(Paired t-test)
检验不同材质间(棉 vs 麻、麻 vs 丝、棉 vs 丝)在八个感知维度上的差异显著性。结果发现,>70%对比显著,尤其在“厚薄”、“冷暖”、“男性化-女性化”维度。 - 相关分析
分析 CIELAB 色彩值与感知评价之间的相关性。例如:- 明度
L*与“丝绸-唤醒度”的相关系数高达 0.89。 a*值(红-绿轴)更强烈影响了麻的“女性化”感知(r=0.50)。b*值(黄-蓝轴)更影响棉布的“愉悦”感知(r=0.55)。
- 明度
- 配对 t 检验(Paired t-test)
3.2 涉及的数据分析原理
- 心理量表 → 定量化
- 把主观的“暖/冷”“喜欢/不喜欢”用 7分制数字化,便于统计。
- 原理:把“定性感受”转化为“定量数据”,才能比较和分析。
- 显著性检验(t检验)
- 判断不同材质或颜色带来的感知差异是否真实存在而非偶然。
- 原理:如果p值 < 0.05,就认为差异显著。
- 相关分析
- 研究数值型变量之间的关系(比如明度和愉悦感)。
- 原理:相关系数 r 接近 ±1 代表强相关,接近 0 代表弱相关。
- 多变量分析
- 一个感知结果往往同时受到多因素(材质、颜色、明度、色相)的影响。
- 原理:通过分解 a*, b*, L* 等参数,找到主导因素。
3.3 生活中的类比与例子
- Likert 量表的生活应用
- 在餐厅吃饭后,你可能被要求对“味道”“服务”“环境”打 1-7 分。这与论文中让受试者评价“冷暖感”“厚薄感”是一样的原理。
- 显著性检验的例子
- 比如商场要验证“红色促销标签是否比蓝色标签更吸引人”。他们可以记录两组标签下的购买率,用t检验来判断差异是否显著。
- 相关分析的例子
- 天气与冰淇淋销量:温度(数值)与销量(数值)常常有正相关,越热卖得越多。
- 对应到论文中:布料越亮(L*值高),受试者对“丝绸-唤醒度”的打分就越高。
- 多变量影响的例子
- 选购一部手机,你的满意度不仅取决于“外观颜色”,还取决于“重量、手感、品牌”。这和论文中研究“颜色+材质共同影响人类感知”是一样的道理。
✅ 总结:这篇论文通过 心理量表 → 定量化、统计检验、相关分析 等方法,揭示了“颜色”和“材质”如何影响人们对织物的感知。这套数据分析思路完全可以迁移到日常场景,比如消费者调查、市场营销、产品设计等领域。
3.4 配对 t 检验
3.4.1 什么是配对 t 检验?
配对 t 检验是一种统计方法,用来比较同一组对象在不同条件下的差异是否显著。
👉 “这两个情况的差别,是真实存在的,还是只是巧合?”
核心思想:看“差异”是不是偶然的。
前提:同一对象在两种情境下都有结果(成对数据)。
结果解读:
- p < 0.05 → 差异显著,说明条件真的影响了结果;
- p ≥ 0.05 → 差异不显著,说明差异可能只是随机波动;
假设你想知道:“苹果手机是不是比安卓手机拍照更好看?”
你找了 50 个朋友,每个人用 同一场景拍两张照片:一张用苹果,一张用安卓。
然后让他们打分(比如 1-7 分)。
如果大家普遍觉得苹果分数更高,而且差距不是一点点,那么配对 t 检验会告诉你:
→ “是的,这差别是真的,不是运气。”
如果差距很小,很多人时高时低,配对 t 检验就会告诉你:
→ “这可能只是随机波动,不算真差别。”
为什么叫“配对”?
因为同一个人要同时体验两种情况(苹果 vs 安卓),结果是一对一对的,这就是“配对数据”。
3.4.2 在论文里的应用
研究者想知道:
“同一种颜色放在不同材质的布料上,人们的感知是不是会变?”
论文比较了同一种颜色,但放在不同材质上(棉 vs 麻、麻 vs 丝、棉 vs 丝),人们的感知是否不同。
例子:
一块“红色棉布” vs “红色丝绸”
受试者对“厚薄感”“冷暖感”“男性化-女性化”打分不同。
如果这个差异在统计学上显著(p < 0.05),就能说明:材质确实会改变人对颜色的感知
- 比如:红色棉布 vs 红色丝绸
- 让同一个人分别给这两块布的“厚薄感、冷暖感、男性化-女性化”等打分。
- 然后比较这两组打分的差异。
如果统计出来差异很大(p<0.05),说明材质真的改变了人们对颜色的感觉。如果差异很小,就说明只是巧合,材质其实没啥影响。
3.4.3 生活中的类比
3.4.3.1 场景 1:咖啡店饮品口感
- 你喝同一款“拿铁”,但杯子材质不同:
- 纸杯 → 感觉比较轻便、普通
- 陶瓷杯 → 感觉更有质感、咖啡更香
- 如果调查 80 个人的评分,再用配对 t 检验,就能判断:“杯子材质”是不是对“口感体验”真的有显著影响。
3.4.3.2 场景 2:考试成绩对比
- 学生在期中考试和期末考试都参加了(同一组学生 → 成对数据)。
- 用配对 t 检验,可以判断:期末的平均分和期中相比是否有显著提高。
- 如果显著 → 说明学习方法/复习有效;如果不显著 → 可能只是随机波动。
3.4.3.3 场景 3:健身前后体重
- 20 个人在健身前、健身后都称体重。
- 用配对 t 检验比较“健身前后体重差异”是否显著。
- 如果显著 → 说明健身计划真的有效。
- 如果不显著 → 说明效果可能并不稳定。
3.5 总结
配对 t 检验 关注的是“同一样本两种条件下的差异”。
在论文中:
→ 是“同一种颜色”放在“不同材质”上,人们打分的差异。
在生活中:
→ 可以用在饮品体验、考试成绩前后对比、健身效果等场景。
这样理解:它就是一把“检测差异是不是靠谱的尺子”。
4. Yu_Westland_Chen_Li_CRA_2021
4.1 论文中的数据分析内容
4.1.1 实验设计与数据收集
- 实验对象:37 位参与者(男女各半)。
- 测试产品:51种不同类别的产品(如闹钟、牙膏、衣服、食品、电子产品等)。
- 颜色选择:6 种基本颜色(红、橙、黄、绿、蓝、紫),使用 Adobe 系统定义并在实验室控制显示条件下呈现。
- 研究方法:
- 6-AFC(6选1强制选择):参与者在每个产品的六种颜色中选择他们最愿意购买的。
- Rank-order 排序:参与者将六种颜色按个人喜好排序。
- 访谈:进一步询问参与者为什么选择某一颜色,以及对颜色本身的联想。
4.1.2 数据分析方法
- 颜色一致率(Colour Consistency Rate)
- 定义:某个产品的颜色选择与参与者个人偏好排序的一致程度。
- 结果:大约 33.7% 的选择落在个人最喜欢的颜色,22.6%落在第二喜欢,依次递减。说明个人颜色偏好会影响购买决策,但不是唯一决定因素。
- 颜色联想分析(Colour Association Analysis)
- 使用 NVivo 软件进行“模板分析法(Template Approach)”。
- 逐步方法:
- 按颜色名称建立编码框架(如红=激情、文化、警示)。
- 对访谈记录进行编码。
- 聚合相似数据,形成主题(如“蓝=冷静”、“绿=自然/清新”)。
- 产品-颜色联想得分(Product-Colour Association Score)
- 定义:产品颜色选择原因中,与颜色本身联想一致的比例。
- 结果:平均得分约为 34.56%。
- 高分产品:除臭剂(83%)、剃须水(82%)、奶酪(76%) → 强烈受颜色联想影响。
- 低分产品:鞋子(3%)、耳机(5%)、游戏机(9%) → 几乎不受颜色联想影响。
- 相关性分析
- 将 产品-颜色联想得分 与 颜色一致率进行相关性检验。
- 结果:相关系数 r² = 0.32(中等相关)。
- 结论:当颜色联想强时,个人偏好影响较弱;反之,个人偏好作用更大。
4.1.3 论文结论
- 消费者的颜色偏好确实影响产品购买颜色的选择,但 颜色联想是新的重要“主导因子”。
- 不同产品类别受到颜色联想的影响差异很大。
- 平均来看,约三分之一的购买理由可以直接追溯到颜色联想。
4.2 涉及的数据分析原理解释
4.2.1 偏好一致性分析(Preference Consistency Analysis)
- 原理:通过比较“个人总体偏好”与“实际选择”,衡量一致性。
- 现实例子:
- 你最喜欢蓝色,但买衣服时并不总选蓝色。若某产品类别(比如牙刷)功能无关颜色,你会更倾向选择蓝色 → 偏好一致率高。
- 但买食物(比如牛奶包装),可能选择白色或绿色,因为它们有“纯净/健康”的联想,即使你不喜欢白色。
4.2.2 质性编码与模板分析(Qualitative Coding & Template Analysis)
- 原理:把受访者的描述转化为分类标签,并统计频率,提炼主题。
- 现实例子:
- 如果受访者说“我觉得蓝色很安静”,研究者会把这句话编码为“蓝=冷静”。
- 类似编码汇总后,就能看出蓝色与“冷静/清爽”联想最强。
4.2.3 相关性分析(Correlation Analysis)
- 原理:通过相关系数检验两个变量之间的关系(如颜色联想得分 vs 偏好一致率)。
- 现实例子:
- 当产品高度依赖颜色联想(如“绿色=环保” → 绿色垃圾桶),消费者不会只按个人最喜欢的颜色买,而是优先考虑“联想”。
- 而鞋子、耳机这类功能/联想弱的产品,消费者会更随个人偏好。
4.3 结合实际生活的例子
- 食品包装
- 红色辣酱:红色=热辣、刺激 → 消费者会认为红色更正宗,即使个人不爱红色。
- 绿色酸奶:绿色=健康、自然 → 更容易让人觉得低脂、环保。
- 日用品
- 蓝色洗衣液:蓝色=清新、干净 → 提高信任感。
- 黄色清洁剂:黄色=强力、去污 → 给人强清洁力的心理暗示。
- 电子产品
- 手机壳:大部分人按个人喜好颜色买,因为功能不依赖颜色。
- 耳机:颜色联想弱,基本随个人审美走。
✅ 总结一下:这篇论文通过 实验+访谈+统计分析+质性编码 的混合方法,验证了一个新的数据分析框架:消费者的产品颜色决策不仅取决于个人偏好,还取决于颜色联想。换句话说,买牙刷可能看个人喜欢的颜色,但买食物、护肤品等更容易受到“红=热辣、绿=健康、蓝=清新”等颜色联想影响。
4.4 流程原理:一步步怎么做?
你可以把它想象成 “收拾一屋子杂乱的书和东西”:
收集材料
论文里:研究者收集了参与者在访谈里说的话,比如“我觉得蓝色很安静”、“绿色让我想到健康”。
生活类比:就像你采访同学“你喜欢什么水果?为什么?”,收集到很多回答:有人说“苹果甜”,有人说“香蕉好消化”,有人说“草莓好看”。
初步分类(建立编码框架)
论文里:研究者先给颜色起标签框架,比如“红=激情、警示”,“蓝=冷静、清新”,“绿=自然、环保”。
生活类比:你把同学的水果理由归类:
味道类(甜、酸)
健康类(好消化、维生素多)
外观类(好看、鲜艳)。
给回答打标签(编码)
论文里:每一句话被标记上对应的标签,比如“蓝色让我想到安静” → 打上“蓝=冷静”;“绿色像大自然” → 打上“绿=自然”。
生活类比:把“我喜欢苹果,因为甜” → 打上标签“味道-甜”;“我喜欢草莓,因为颜色好看” → 打上标签“外观-好看”。
聚合同类信息(模板分析 Template Approach)
论文里:所有“蓝=冷静”的回答聚在一起,所有“绿=自然”的回答聚在一起。最后统计每类出现的次数和比例。
生活类比:你发现大部分同学喜欢水果是因为“味道”,其次是“健康”,最后才是“外观”。
总结规律
- 论文结果:发现消费者选择某些产品颜色的原因,跟这些颜色的“典型联想”是一致的。比如:
- 绿色牙膏 → 因为“绿色=清新、自然”;
- 蓝色洗衣液 → 因为“蓝色=干净、冷静”。
- 生活类比:你总结出 → 人们选水果,味道因素(甜/好吃)比外观因素(好看)更重要。
- 论文结果:发现消费者选择某些产品颜色的原因,跟这些颜色的“典型联想”是一致的。比如:
4.5 为什么叫“模板分析”?
“模板”不是 PPT 模板,而是指一个 “初步的分类框架”。研究者先假设一些可能的分类(比如颜色=联想),然后在收集到的数据里不断验证和调整。
一开始模板可能粗糙:
- 红色=激情;
- 蓝色=冷静;
- 绿色=自然。
收集到更多回答后,可能细化:红色不仅是激情,还可能是“警示”;蓝色不仅冷静,还可能是“科技感”。
👉 模板就像“空格表格”,数据填进去,最后形成更准确的分类体系。
4.6 举个完整生活例子
假设你要研究 “人们为什么喜欢不同的饮料”:
访谈收集到的话:
- “我喜欢可乐,因为它让我兴奋。”
- “我喜欢绿茶,因为很健康。”
- “我喜欢牛奶,因为有营养。”
- “我喜欢果汁,因为酸甜可口。”
建立模板(初步分类框架):
- 功能类(健康、营养)
- 体验类(兴奋、味道)
编码:
- 可乐=体验类-兴奋
- 绿茶=功能类-健康
- 牛奶=功能类-营养
- 果汁=体验类-味道
聚合:
- 功能类:健康+营养 = 2票
- 体验类:兴奋+味道 = 2票
总结规律:
- 一半人喜欢饮料是因为功能(健康、营养),一半是因为体验(好喝、刺激)。
总结:质性编码与模板分析 = 用标签法,把零散的文字答案变成有规律的数据,再总结出普遍规律。
就像:- 收拾房间 → 把书放到书架,衣服放到衣柜,玩具放到盒子。
- 研究访谈 → 把“蓝色=冷静”“绿色=自然”都归到一个类里,再统计多少人这么说。
5. SPSS 与 Python 对比表
| 对比维度 | SPSS | Python |
|---|---|---|
| 定位 | 专业统计软件,主要用于社会科学、医学、教育研究 | 通用编程语言,覆盖统计分析、数据挖掘、机器学习、AI |
| 操作方式 | 主要通过 图形界面 (GUI),也支持 SPSS Syntax | 通过 编程(pandas、numpy、scikit-learn、statsmodels 等库) |
| 学习门槛 | 入门简单,统计基础 + 软件操作即可 | 需要学编程,门槛较高,但学习后能力更广 |
| 输出结果 | 自动生成标准化结果表、显著性检验、置信区间,论文可直接用 | 输出灵活,可自定义表格、图表、报告,但需额外代码处理 |
| 功能深度 | 传统统计分析强大(t检验、ANOVA、回归、因子分析等) | 不仅能做统计,还能做 机器学习、深度学习、NLP 等 |
| 扩展性 | 扩展性差,依赖 SPSS 本身功能 | 可通过库无限扩展,和数据库、网页爬虫、API 结合 |
| 可重复性 | GUI 操作难以完全复现,Syntax 脚本有限 | 代码高度可复现,可一键自动化批量处理 |
| 适用人群 | 非程序员、社会科学/医学/教育研究者 | 数据科学家、数据分析师、程序员、科研人员 |
| 成本 | 商业软件,费用高 | 开源免费 |
| 学习资源 | 教材、培训课程多,偏应用导向 | 学习资料更丰富,社区活跃,偏技术导向 |
5.1 优势对比
2025 年 8 月 31 日
社会因不同而发展,市面所上市发布的软件都是发布通用性,不具有针对性。而针对性的软件功能,等企业给你开发是不切实际的,不要觉得自身的需求对于软件公司“很重要”。自己想要的,还是得自己去实现,就这么简单。
故而一般我们都会选择 SPSS + Python 结合开发使用。
核心还是需要自己有想法💡
5.1.1 SPSS 的优势
- 上手快,点点鼠标就能跑统计,适合非程序员。
- 输出结果直观,符合论文要求(表格/显著性/置信区间)。
- 教学和社会科学研究中应用广泛,培训课程多。
5.1.2 Python 的优势
- 免费开源,成本低。
- 灵活性强,不仅能做统计,还能做机器学习、AI、自动化。
- 可扩展性极高(和 Excel、数据库、网页爬虫、API 结合)。
- 高度可重复,适合科研、工业级项目。
- 社区活跃,学习资源丰富。
📌 总结一句话:
- SPSS 更像“统计计算器” → 快速得出结果,适合研究者。
- Python 更像“统计实验室” → 你能自定义方法、自动化、扩展到 AI。
6. The Effects of colour in human fabric perceptions
6.1 论文中的数据分析内容
实验方法设计(数据收集方式)
- N-Alternative Forced Choice (N-AFC):让参与者从多个颜色中选择自己最喜欢的。
- Rank-Order 排序:要求参与者按喜好程度对所有颜色进行排序。
- Rating 评分:让参与者对每个颜色进行打分(如 0–100 分)。
- Paired Comparison 成对比较:让参与者两两比较颜色,每次选出一个。
👉 这些方法产生了不同类型的数据(分类数据、排序数据、区间数据),论文通过这些实验获取人类对布料颜色的偏好与感知。
统计分析方法
方差分析 (ANOVA):用来比较不同颜色、不同布料在感知结果上的差异是否显著。
相关分析:研究颜色偏好和其他特征(如材质光滑度、柔软度)之间的关系。
多维尺度分析 (MDS):把复杂的颜色感知数据映射到二维或三维空间中,帮助直观地看出颜色之间的相似度。
聚类分析:将偏好相近的颜色或布料分到一组,发现潜在模式。
关键结论
不同颜色显著影响人们对布料的“温暖感、柔软感、质量感”的主观评价。
数据显示,暖色调(红、橙)更容易让人觉得布料柔软温暖;冷色调(蓝、绿)更偏向“坚硬、清凉”的感知。
色彩与材质本身的交互效应也很明显:同一种颜色在丝绸和粗布上的感知完全不同。
6.2 数据分析原理解释 + 生活例子
Forced Choice / 排序 / 打分
- 原理:通过不同的调查问法获取不同粒度的数据。
- 例子:你去奶茶店,老板问你:
- Forced Choice:你要奶茶还是咖啡?(二选一)
- Rank-Order:把奶茶、咖啡、果汁、可乐从最喜欢到最不喜欢排个顺序。
- Rating:给奶茶、咖啡、果汁分别打分(比如奶茶 90 分,咖啡 70 分)。
- 这三种方式得到的数据不同,研究者根据实验目的选择合适的方法。
方差分析 (ANOVA)
原理:比较多个组的均值,看差异是不是“显著”而不是随机波动。
例子:假设有 30 个人试穿三种颜色的 T 恤(红、蓝、绿),然后对“舒适度”打分。ANOVA 能告诉我们红色和蓝色 T 恤的舒适度评分差异是不是有统计意义,而不是因为“碰巧样本不同”。
多维尺度分析 (MDS)
原理:把“相似度”或“距离”数据映射到二维/三维图里,让人能直观理解。
例子:假设你喜欢的饮料有奶茶、绿茶、咖啡、可乐。别人觉得奶茶和绿茶很像,但咖啡和可乐差异大。MDS 会画出一个二维坐标图,把“像的东西”放在一起,“不像的东西”放远一点。
聚类分析
原理:把数据分组,让同类的东西聚在一起。
例子:商场根据购物记录把人群分为“爱买运动装”“爱买奢侈品”“爱买居家用品”。
在论文里,研究者把“偏好相似的颜色和布料”分组,帮助时尚设计师定位市场。
✅ 总结:
这篇论文主要用到了 实验设计 + 统计分析方法(ANOVA、相关分析、MDS、聚类) 来研究颜色对布料感知的影响。
现实生活中,你可以把这种分析方法类比到 饮料选择、衣服购买、甚至美食口味 上,用不同的数据收集和分析方法,帮助理解人们的偏好和感知规律。
公众号:AI悦创【二维码】

AI悦创·编程一对一
AI悦创·推出辅导班啦,包括「Python 语言辅导班、C++ 辅导班、java 辅导班、算法/数据结构辅导班、少儿编程、pygame 游戏开发、Web、Linux」,招收学员面向国内外,国外占 80%。全部都是一对一教学:一对一辅导 + 一对一答疑 + 布置作业 + 项目实践等。当然,还有线下线上摄影课程、Photoshop、Premiere 一对一教学、QQ、微信在线,随时响应!微信:Jiabcdefh
C++ 信息奥赛题解,长期更新!长期招收一对一中小学信息奥赛集训,莆田、厦门地区有机会线下上门,其他地区线上。微信:Jiabcdefh
方法一:QQ
方法二:微信:Jiabcdefh

更新日志
e65ca-于17ab1-于107e2-于a5866-于070e4-于22945-于f1f17-于65096-于9ce9b-于a2098-于56a20-于03c45-于