“Luiz de Queiroz” College of Agriculture

CAU-USP Joint College

SBC-11201 Genetics and Breeding course

Quantitative Genetics (数量遗传学)

Prof. Saulo Chaves

Piracicaba, São Paulo, Brazil
December 2025

Content (内容)

  1. Background (背景)
  2. Genetic basis of inherited traits (遗传性状的遗传基础)
    • Qualitative traits (定性特征)
    • Quantitative traits (数量性状)
  3. Experimentation and statistical genetics (实验与统计遗传学)
    • Gaussian distribution (高斯分布)
    • Principles of experimental design (实验设计原理)
    • \(P = G + E\) (表型等于基因型加上环境)
    • Heritability (遗传性)

Background (背景)

植物育种是一门科学、艺术和商业,它通过改变植物的遗传特性来造福人类。它是提高粮食(以及其他农业原材料)产量的最生态合理的方式,其核心在于使植物适应环境,而不是使环境适应植物。

Adapted from Wallace et al. (2018)

Background (背景)

遗传学是一门研究可遗传变异的科学领域,它与有性生殖(通过减数分裂产生配子、受精)密切相关。

Background (背景)

Background (背景)

变异范围较广的性状无法用经典的孟德尔遗传学方法进行分析。

Genetic basis of inherited traits (遗传性状的遗传基础)

Qualitative traits (定性特征)

  • 单基因或寡基因
  • 可区分的表型类别
    • 基因型类别的替代指标
    • 孟德尔遗传学
  • 环境影响较小

Qualitative traits (定性特征)

通常情况下,与颜色和形状相关的性状是寡基因控制的(但这并非绝对规律)。

Quantitative traits (数量性状)

表型类别没有明显的区别

Quantitative traits (数量性状)

多基因遗传假说

连续性状由一组基因决定,这些基因单独分析时,其行为符合孟德尔规律。

Quantitative traits (数量性状)

  • \(\Uparrow\) 基因数量 (\(n\)), \(\Uparrow\) 可能的基因型类别数量
  • 基因型类别数量 = \(3^n\)

Quantitative traits (数量性状)

  • \(\Uparrow\) 基因数量, \(\Uparrow\) 表型类别数量
  • 可能的表型类别数量: \(2^n\)
    • 考虑到完全优势

Quantitative traits (数量性状)

  • 多基因遗传
  • 受环境影响显著
    • \(\mathbf{P = G + E}\)
  • 经济性状
  • 群体研究
    • 统计方法

Quantitative genetics (数量遗传学)

数量遗传学是利用统计方法在大群体中研究多基因遗传性状的学科。

Sir Ronald Fisher

  • 奠定了现代统计学的基础
  • 数量遗传学和统计遗传学的创始人
  • 在进化和植物育种中发挥了重要作用

Quantitative genetics (数量遗传学)

Quantitative genetics (数量遗传学)

Reinforcement exercise (强化练习)

结合你目前在本课程中所学到的所有内容,解释数量遗传学对植物育种的重要性。

Experimentation and statistical genetics (实验与统计遗传学)

Statistics (统计数据)

在数量遗传学中,遗传现象是在群体中进行研究的。

Statistics (统计数据)

  • 平均值:位置的度量

\[ \overline{x} = \frac{\left(x_1 + x_2 + x_3 + ... + x_n \right)}{N} \]

  • 方差:离散程度的度量

\[ \sigma^2 = \left(\frac{1}{N-1} \right)\sum \left(x_i-\overline{x}\right)^2 \]

Gaussian distribution (高斯分布)

\[ f(x) = \frac{1}{\sigma \sqrt{2 \pi}} e^{-\frac{1}{2} \left(\frac{x-\overline{x}}{\sigma} \right)^2} \]

Gaussian distribution (高斯分布)

Gaussian distribution (高斯分布)

Statistical genetics (统计数据)

\[ P = G + E \]

  • 我们所看到的,与我们在基因层面上所拥有的并不完全一致。
  • 噪音:
    • 等位基因内和等位基因间相互作用 (\(G\))
    • 环境影响 (\(E\))
    • 基因型与环境的互作 (\(G\times E\))

多基因遗传的特点是许多基因共同作用,每个基因的影响都很小。

Statistical genetics (统计数据)

均值和方差也可以分解:

\[ \begin{array} . & & \mathbf{P} & = & \mathbf{G} & + & \mathbf{E} \\ \hline 1 & \to & P_1 & = & G_1 & + & E_1 \\ 2 & \to & P_2 & = & G_2 & + & E_2 \\ 3 & \to & P_3 & = & G_3 & + & E_3 \\ \vdots & & & & \\ N & \to & P_N & = & G_N & + & E_N \\ \hline \overline{x} & \to & \overline{P} & = & \overline{G} & + & \overline{E} \\ \sigma^2 & \to & \sigma^2_{P} & = & \sigma^2_G & + & \sigma^2_E \end{array} \]

Experimentation (实验)

\[ P = G + E \]

  • 目标:根据\(G\)进行选择
  • 障碍:只有 \(P\) 可观测
  • 解决方案:实验!

实验是研究因果关系和运用科学方法进行决策的关键。它的目的是规划、执行、数据收集、数据分析和结果解释,是统计学不可或缺的一部分。没有好的实验,就不会有好的结果!

Experimentation (实验)

田间试验可以将\(G\)\(P\)区分开来

Experimentation (实验)

  • 项预先计划好的研究,遵循某些基本原则,旨在比较各种处理方法的效果。
  • 两种变量之间的因果关系:
    • 因果变量或处理方法(定量和定性层面)
    • 响应变量
  • 处理方法:实验中希望测量或比较其效果的材料。

Experimentation (实验)

\[ \underbrace{F}_{\mbox{阴谋}} = \underbrace{G}_{\mbox{治疗}} + \underbrace{E}_{\mbox{错误}} \]

Principles of experimentation (实验原理)

  • 假设我们要测试 4 个马铃薯克隆品种

  • 事先我们知道它们都很好

  • 在特定区域内,我们想知道哪个品种最好

  • 解决方案:设计一个实验

  • 实验 1:

Principles of experimentation (实验原理)

Replication
  • 提高检验检测差异的能力。
  • 提高参数估计的准确性。
  • 确保获取实验误差。

Principles of experimentation (实验原理)

Randomization
  • 确保不偏袒任何一种治疗方法。

  • 验证实验误差的估计。

  • 确保实验误差的独立性

Principles of experimentation (实验原理)

Local control
  • 如果实验中存在可控干扰因素(例如梯度)

  • 由于随机误差,影响会降低

  • 结果更可靠

Experimental designs (实验设计)

  • 完全随机设计
  • 重复和随机化
  • 适用于环境条件均一的测试
    • 例如:温室、实验室等
  • 最简单

Experimental designs (实验设计)

  • 随机完全区组设计
  • 具有重复性、随机化和局部控制的特点
  • 适用于环境条件异质性较大的试验
    • 例如:田间试验
  • 最常用

A typical field trial (典型的田间试验)

dat = read.csv("https://raw.githubusercontent.com/saulo-chaves/MHT_MET_MM/main/Data/D1.csv", stringsAsFactors = TRUE)
dat = droplevels(dat[which(dat$yr == "H05"),])
str(dat)
'data.frame':   125 obs. of  7 variables:
 $ yr   : Factor w/ 1 level "H05": 1 1 1 1 1 1 1 1 1 1 ...
 $ gen  : Factor w/ 25 levels "MK01","MK02",..: 1 2 3 4 5 6 7 8 9 10 ...
 $ block: Factor w/ 5 levels "B1","B2","B3",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ plot : Factor w/ 125 levels "MK01B1","MK01B2",..: 1 6 11 16 21 26 31 36 41 46 ...
 $ row  : int  1 1 1 1 1 1 1 1 1 1 ...
 $ col  : int  13 1 18 9 10 16 22 20 23 4 ...
 $ fy   : num  28.8 28.1 23.5 27.6 27.2 ...

A typical field trial (典型的田间试验)

desplot::desplot(data = dat, form = fy ~ row + col, out1 = block)

A typical field trial (典型的田间试验)

  • 方差分析
mod = aov(formula = fy ~ gen + block, data = dat)
summary(mod)
            Df Sum Sq Mean Sq F value Pr(>F)   
gen         24   3366  140.24   2.319 0.0021 **
block        4    268   67.10   1.110 0.3566   
Residuals   96   5805   60.47                  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

A typical field trial (典型的田间试验)

  • 媒体比较测试
tuk = agricolae::HSD.test(y = mod, trt = "gen", alpha = .05, group = TRUE)
plot(tuk)

Heritability (遗传性)

  • 由遗传变异导致的表型变异比例

\[ H^2 = \frac{\sigma^2_G}{\sigma^2_G + \sigma^2_E} \]

  • 所有性状都具有遗传力
    • 定性性状:高
    • 定量性状:低
  • 高遗传力或低遗传力意味着什么?

Heritability (遗传性)

            Df Sum Sq Mean Sq F value Pr(>F)   
gen         24   3366  140.24   2.319 0.0021 **
block        4    268   67.10   1.110 0.3566   
Residuals   96   5805   60.47                  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

假设:

\[ \hat{\sigma}^2_E = MS_E = 60.47 \]

\[ \hat{\sigma}^2_G =\frac{MS_G - MS_E}{r} = \frac{140.24-60.47}{5} = 15.954 \]

\[ H^2 = \frac{\sigma^2_G}{\sigma^2_G + \sigma^2_E} = \frac{15.954}{15.954 + 60.47} = 0.21 \]

Heritability (遗传性)

\[ H^2 = \frac{\sigma^2_G}{\sigma^2_G + \sigma^2_E} = \frac{15.954}{15.954 + 60.47} = 0.21 \]

观察到的变异中约有21%是由遗传因素造成的。遗传力越高,选择就越容易、越成功。

Reinforcement exercise (强化练习)

使用提供的数据集,计算表型 (fy) 的均值和方差。然后,使用课堂上相同的模型进行方差分析。进行均值比较检验,并仅选择组“a”中唯一的基因型。报告所有基因型均值与仅选择这些基因型的均值之间的差异。最后,计算遗传力并解释结果。

谢谢