Entenda Linkage de uma vez por todas.
Segundo vozes da minha cabeça e gritos dos meus alunos, essa é a matéria da genética mais responsável por unhas roídas, quedas de cabelo e taquicardias. Seja você um aluno de graduação, de Ensino Médio e/ou vestibulando, chegou a hora de você entender direitinho o que é Linkage, taxa de crossing-over e mapa genético. Antes, é importante que você conheça a meiose, já tenha lido o conteúdo de Genética do Biologia em Pauta, no que diz respeito à primeira e segunda lei de Mendel, e é legal que tenha lido também um post que fiz aqui no Blog sobre probabilidade aplicado à genética. Isso vai te ajudar a não boiar aqui.
Primeiro, um pequeno apanhado histórico. Depois da redescoberta dos trabalhos de Mendel, o estudo da herança genética voltou com tudo na Europa. William Bateson e Reginald Punnett (ele mesmo, do quadro de Punnett), ao estudar a herança de algumas características na Ervilha-de-cheiro, mais especificamente os genes A e P, não observaram a herança prevista por Mendel para esse tipo de cruzamento (9:3:3:1).

A Cor da flor é determinada pelo gene P (Púrpura dominante e vermelha o fenótipo recessivo) e o tipo de grão de pólen, pelo gene A (grão alongado é a característica dominante e arredondado, recessiva).
No quadro, você vai poder ver que as frequências encontradas pelos cientistas nada tinha a ver com aquela esperada dentro da proporção mendeliana. Eles não souberam explicar porque, neste caso, alguns fenótipos tinham frequências observadas maiores do que as esperadas, enquanto outras possuíam essas frequências menores, mas disseram que nesta situação estes genes estariam em “Associação” ou "Repulsão". Em 1910, apenas uma década depois, Morgan e colaboradores, após estudarem duas características na mosca da fruta (a famosa Drosophila melanogaster), concluíram que 'Associação' e 'Repulsão' eram aspectos de um fenômeno geral que recebeu o nome de Linkage, ou seja, que os genes para as características estudadas por eles estavam localizadas no mesmo cromossomo. Que diferença isso faz? Continua que eu te explico:

Você que está me lendo tem um conjunto de 46 cromossomos em cada célula sua, que estão dispostos em 23 pares, como a imagem ao lado demonstra. Quando a gente estuda a herança considerando mais de um gene, tipo indivíduos AaBb ou, sei lá, RrKKff, normalmente estamos considerando que os genes A e B ou R, K e F, estão em cromossomos diferentes. É só você olhar para a imagem do cariótipo humano e pensar, por exemplo, como se um indivíduo AaBb tivesse o gene A no cromossomo 10 e o gene B no cromossomo 19.
Estar em cromossomos diferentes é o critério básico para a segregação independente, descrita na 2ª Lei de Mendel. Essa segregação independente faz com que tenhamos sempre proporções iguais entre os possíveis gametas gerados no processo de meiose. Por exemplo: um organismo AaBb pode formar 4 gametas diferentes no que diz respeito à herança desses dois genes específicos. Ou seja, estando os genes A e B em cromossomos diferentes, consideramos que um alelo de cada gene vai formar o material genético do gameta, então haveria a possível formação de quatro tipos de gametas diferentes: AB, Ab, aB e ab. Segundo a lógica estatística da segregação independente, todos têm a exata mesma chance de acontecer. Ou seja, 1/4 ou 25%.

Mas, o que acontece com essa lógica quando os genes que estamos considerando estiverem no mesmo cromossomo? Na imagem ao lado estamos considerando justamente isso: os genes A e B estão no mesmo cromossomo, um mais em cima e outro mais na porção terminal da molécula. Sem crossing-over, temos tudo acontecendo normalmente: ainda na interfase, o material genético se duplica, na primeira fase da meiose, separam-se os cromossomos homólogos e na segunda fase, separam-se as cromátides-irmãs. Perceba que geramos duas variedades de gameta: AB e ab. Ou seja, simplesmente separamos o que tínhamos ali no início, certo? Isso pois, quando estamos pensando em genes ligados, ou seja, que estão no mesmo cromossomo, vamos considerar a priori que esse cromossomo é inteiramente direcionado para uma célula filha, logo, tanto o gene A, quando o B, serão direcionados de forma agregada, juntos, coladinhos, carne e unha, alma gêmeas.

Só que em cerca de 20 e 30% das meioses que ocorrem nas células, rola um evento chamado crossing-over. Se você não lembra, se trata daquele evento onde cromossomos de pares homólogos trocam fragmentos de DNA, formando algumas recombinações.

Aí olha o que acontece com os gametas que são formados. Aqueles cromossomos que não sofreram recombinação, por estarem nas faces externas desse alinhamento, conforme a imagem mostra, carregam a informação original da célula-mãe, sem quaisquer alterações. Nesse exemplo, AB e ab, que chamamos de cromossomos parentais. Aqueles que sofreram crossing-over e foram recombinados, chamamos de cromossomos recombinantes. Nesse exemplo, Ab e aB. Então temos 4 gametas possíveis sendo originados a partir de uma meiose com crossing-over, que não é algo exatamente raro de ocorrer. Aí você me pergunta: qual a diferença disso para a segregação independente, se não é o número de gametas possíveis? te respondo: a frequência que cada um ocorre.
Lá na segregação independente, com genes em cromossomos diferentes, tínhamos chances iguais para cada gameta possível. Se tínhamos 2, 50% pra cada; se eram 4, 25% para cada. Com genes ligados, sem crossing-over vamos ter apenas 2 gametas possíveis, onde cada um tem os mesmos 50% de chance de ocorrer, mas quando consideramos a ocorrência de crossing-over, vemos a formação de 4 gametas possíveis, mas que não possuem chances iguais de ocorrer, visto que dependem diretamente da chance de crossing-over acontecer. Como eu já disse anteriormente, as células apresentam esse fenômeno em cerca de 20 a 30% das meioses, em média. Assim, a probabilidade, logo, a quantidade de cromossomos recombinantes vai depender diretamente de quantas vezes o crossing-over ocorreu, já que ele é o evento gerador desse tipo de cromossomo. Então, em vez de vermos 4 gametas possíveis, cada um com 25%, é comum que vejamos que os gametas parentais sejam muito mais frequentes se comparados com os recombinantes, pois a chance do crossing-over não ocorrer é maior do que a chance dele ocorrer.

Então agora que você já entendeu essa parte, vamos dar só mais um passo além. Se você concordou comigo que a frequência dos gametas recombinantes é sempre proporcional à taxa de crossing over, você vai ter que concordar também que quanto mais distantes os genes estiverem nesse cromossomo, maior a chance de acontecer crossing-over entre eles, levando à sua separação e à formação de um gameta recombinante.
É lógico: se os genes A e B estão coladinhos, a chance de acontecer crossing-over exatamente entre eles, de modo que eles sejam separados, é muito menor do que se eles estiverem mais distantes. Essa relação é tão intrínseca e tão importante, que podemos fazer a seguinte inferência: 1% de taxa de crossing-over significa 1uM(*) de distância entre os genes. Ou seja, uma frequência de 18% significa que 18 em 100 cromossomos tiveram um crossing entre os genes analisados. Isso nos deixa a conclusão que esses genes estão a 18uM de distância.
Quanto mais distantes estiverem os genes, maior será a probabilidade de ocorrência de um crossover e mais alta será a proporção de produtos recombinantes. Portanto, a proporção de recombinantes é uma indicação da distância que separa dois genes em um mapa cromossômico
Agora, uma outra diferença importante de quando estamos analisando genes ligados em relação à genes com segregação independente, é que os genes ligados possuem mais de um arranjo possível para o mesmo genótipo. Perceba: quando falamos que o cara é AaBb, sendo A e B genes independentes, Só tem um jeito de isso acontecer. Ele tem um par de cromossomos homólogos onde um tem o alelo /A/ e outro tem o alelo /a/ e ele tem outro par de cromossomos homólogos onde um tem o alelo /B/ e o outro tem o alelo /b/. Sem crise. Agora, se A e B forem genes ligados, existem duas formas de um indivíduo ser AaBb, como você pode observar na imagem abaixo.

Em ambos os arranjos o indivíduo é AaBb, certo? Mas enquanto no arranjo cis, os alelos dominantes estão de um lado e os recessivos de outro, no arranjo trans existe um alelo recessivo junto com um alelo dominante em cada um dos cromossomos do par. É sempre importante saber isso quando estamos estudando linkage, para definirmos qual exatamente é o gameta recombinante e qual é o parental. Pois veja, na conformação trans, os gametas parentais são Ab e aB, já os recombinantes são AB e ab. Na conformação cis é o oposto: os gametas recombinantes são Ab e aB, já os parentais são AB e ab. Então, quando se trata de genes ligados, a representação mais comum não é AaBb, como acontece em genes independentes. Nesse caso, AaBb ainda nos deixa sem informação sobre qual arranjo esse individuo possui, né? Então representamos o cis como AB/ab e o trans como Ab/aB.
MAPAS GENÉTICOS
Pra fechar, a gente entra em uma parte mais vista na graduação que é a construção de Mapas Genéticos levando em consideração três ou mais genes ligados. É importantíssimo que você tenha entendido tudo até agora para seguir, ok?
O método básico do mapeamento de genes com a utilização das frequências de recombinantes foi planejado por um aluno de Morgan, Alfred Sturtevant. Na medida em que Morgan estudava mais e mais genes ligados, ele observou que a proporção de gametas recombinantes variava consideravelmente, dependendo de quais genes ligados estavam sendo estudados, logo, pensou que essa variação poderia de algum modo indicar as distâncias reais que separam os genes nos cromossomos, conforme já adiantamos mais acima.
Também conforme já expliquei, quanto maior a distância entre os genes ligados, maior a chance de crossovers na região entre os genes e, portanto, maior a proporção de gametas recombinantes que será produzida. Consequentemente, ao determinar a frequência de recombinantes, podemos obter uma medida da distância entre os genes no mapa. De fato, Sturtevant definiu uma unidade de mapa genético (u.m.) como a distância entre genes em relação aos quais 1 produto da meiose em 100 é recombinante. Por exemplo, a frequência de recombinantes (FR) de 10,7% é definida como 10,7 u.m. Uma unidade de mapa por vezes é denominada um centimorgan (cM), em homenagem a Thomas Hunt Morgan, seu professor.
Então, pensando em três genes ligados, em um mesmo cromossomo, se 5 unidades de mapa (5 u.m.) separam os genes A e B, e 3 u.m. separam os genes A e C, então a distância que separa B e C deve ser ou 8 ou 2 u.m. Certo? em Drosophila, por exemplo, o locus do gene da cor dos olhos (pr) e o locus do gene do comprimento das asas (vg) estão a uma distância de aproximadamente 11 u.m. Normalmente representamos essa informação da seguinte forma:

Assim, conhecendo esse valor, sabemos que haverá 11% de recombinantes na progênie no cruzamento entre um indivíduo diíbrido de conformação cis e um totalmente recessivo (ou seja, cruzamento de um indivíduo com os dois genes em heterozigose com outro com todos os genes em homozigose recessiva).
Ou seja, dentro das quatro possibilidades, duas parentais e duas recombinantes, conforme já vimos falando. Esses recombinantes consistirão em dois recombinantes recíprocos de igual frequência. O que isso quer dizer? Que de 100 gametas, 11% serão recombinantes e 89% serão parentais.
5,5% serão pr vg+ e 5,5% serão pr+ vg (ou seja, os gametas recombinantes vão 'dividir' esses 11% pelas duas classes).
Os parentais também fazem o mesmo, ou seja, dividem os 89% nas suas duas classes de forma igual, 44,5% pr+ vg+ e 44,5% pr vg.
OBS: Existem exceções causadas por hotspots (“pontos quentes”) de recombinação, locais no genoma em que o crossing over ocorre de modo mais frequente do que o habitual. A presença de hotspots causa a expansão proporcional de algumas regiões do mapa. Também são conhecidos bloqueios de recombinação, que apresentam o efeito oposto. Mas, não vamos adentrar muito nessas implicações agora.
O 'ponto alto' dos mapas genéticos é o cruzamento-teste de três pontos. Até agora, observamos a ligação em cruzamentos de diíbridos (ou seja, heterozigotos duplos, tipo AaBb) com recessivos duplos (tipo aabb). O próximo nível de complexidade é um cruzamento de um tri-híbrido (heterozigoto triplo, tipo AaBbCc) com um testador recessivo triplo (aabbcc). Esse tipo de cruzamento, denominado cruzamento-teste de três pontos ou cruzamento de três fatores, é comumente utilizado na análise de ligação. O objetivo, e a razão pelo qual ele é maneiro, é que ele te permite deduzir se três genes estão ligados e, caso afirmativo, deduzir a sua ordem e as distâncias de mapa entre eles. Vamo lá, devagar devagarinho.

Considera primeiro o cruzamento de entre duas moscas: uma Abh/Abh e outra aBH/aBH. Toda a prole será igual, visto que por serem homozigotos, os parentais só produzem um tipo de gameta. Então toda a prole na F1 será Abh/aBH. Se pegarmos as fêmeas desse grupo e cruzarmos com machos totalmente recessivos, fazemos o 'cruzamento-teste de três pontos'.
Nesse caso, o fenótipo vai depender sempre exclusivamente da fêmea, pois se ela doar alelo recessivo, o recessivo estará duplicado e o fenótipo será também recessivo. Se a fêmea doar o alelo dominante, a prole será heterozigota para aquele gene, logo, terá fenótipo dominante. Então, nesse tipo de cruzamento a composição da prole depende totalmente da contribuição materna. Entendido isso, vemos que a prole, que totalizou 1448 indivíduos (números que tirei da cabeça, ok?), exibiu os seguintes fenótipos, descritos no quadro:

O mais importante a partir daqui é já definirmos que, dos 8 genótipos possíveis, temos 2 que são parentais, 2 que são consequência do crossing over entre os genes A e B, 2 que são consequência do crossing over entre B e C e 2 que são consequência de crossing over entre A e B E TAMBÉM entre B e C, ou seja, um crossing-over duplo. Os mais presentes, ou seja, que têm em maior quantidade são sempre aqueles parentais. Isso é fácil de matar.
O que a gente tem que fazer aqui é o seguinte. Primeiro, calcular o quanto que a quantidade de cada categoria significa em porcentagem em relação ao total e depois somar aqueles que pertencem à mesma 'categoria', ou seja, são complementares assim como mostro no quadro a seguir.

Perceba que os dois genótipos da mesma categoria são 'complementares', tipo abh e ABH ou aBH e Abh. Agora, só falta a gente entender o que cada categoria significa em termos de "onde" o crossing-over aconteceu.

Perceba, então, que os genótipos ABH e abh, por exemplo, são resultantes, na verdade, de um crossing-over entre A e B, e totalizam 13% dos genótipos na prole. Temos que somar aqui o resultado também do duplo-crossing, que é de 6%, pois ele também é um evento que, querendo ou não, implica em um crossing entre A e B. Isso significa que a distância entre A e B é de aproximadamente 19 u.m.
Fazendo o mesmo para o crossing-over entre os genes B e H, que resulta nos genótipos AbH e aBh, que totalizam 1% dos genótipos da prole, somando o resultado do duplo-crossing, logo, B e H distam de 7 u.m.
Quando fazemos isso para a recombinação entre A e H, vemos que uma recombinação que separe os genes A e H pode gerar ABH e abh ou AbH e aBh. Essas categorias somam aproximadamente 13,2% (a tabela trouxe porcentagens arredondadas).
Ou seja, agora é só usar a lógica.
A e B - aprox. 19 u.m.
A e H - aprox. 13 u.m.
H e B - aprox. 7 u.m.
A única conformação possível para arranjarmos esses loci é A H B e não "ABH" como tínhamos esquematizado inicialmente. Desenhamos o respectivo mapa genético dessa forma:

E ah, pra não deixar passar uma provocação em branco, como saber se são genes ligados ou não? Toda vez que esse calculo resultar em um número inferior a 50% ou 50 u.m., se trata de genes ligados, mas isso é assunto pra aprofundar em uma próxima!