Regressão logística versus linear
Na análise estatística, é importante identificar as relações entre as variáveis envolvidas no estudo. Às vezes, pode ser o único objetivo da própria análise. Uma ferramenta forte empregada para estabelecer a existência do relacionamento e identificar o relacionamento é a análise de regressão.
A forma mais simples de análise de regressão é a regressão linear, onde a relação entre as variáveis é uma relação linear. Em termos estatísticos, evidencia a relação entre a variável explicativa e a variável resposta. Por exemplo, usando regressão, podemos estabelecer a relação entre o preço da commodity e o consumo com base nos dados coletados de uma amostra aleatória. A análise de regressão produzirá uma função de regressão do conjunto de dados, que é um modelo matemático que melhor se ajusta aos dados disponíveis. Isso pode ser facilmente representado por um gráfico de dispersão. A regressão gráfica é equivalente a encontrar a melhor curva de ajuste para o conjunto de dados fornecido. A função da curva é a função de regressão. Usando o modelo matemático, o uso de uma mercadoria pode ser previsto por um determinado preço.
Portanto, a análise de regressão é amplamente utilizada na previsão e previsão. Também é usado para estabelecer relacionamentos em dados experimentais, nos campos da física, química e em muitas ciências naturais e disciplinas de engenharia. Se o relacionamento ou a função de regressão for uma função linear, o processo será conhecido como regressão linear. No gráfico de dispersão, ele pode ser representado como uma linha reta. Se a função não for uma combinação linear dos parâmetros, a regressão será não linear.
A regressão logística é comparável à regressão multivariada e cria um modelo para explicar o impacto de múltiplos preditores em uma variável de resposta. No entanto, na regressão logística, a variável de resultado final deve ser categórica (geralmente dividida; isto é, um par de resultados alcançáveis, como morte ou sobrevivência, embora técnicas especiais permitam modelar informações mais categorizadas). Uma variável de resultado contínuo pode ser transformada em uma variável categórica, a ser usada para regressão logística; no entanto, o recolhimento de variáveis contínuas dessa maneira é principalmente desencorajado, pois reduz a precisão.
Diferentemente da regressão linear, em relação à média, as variáveis preditoras em regressão logística não precisam ser compelidas a serem conectadas linearmente, distribuídas normalmente ou a terem variações iguais dentro de cada cluster. Como resultado, a relação entre as variáveis preditoras e de resultado provavelmente não será uma função linear.
Qual é a diferença entre regressão logística e linear?
• Na regressão linear, é assumida uma relação linear entre a variável explicativa e a variável de resposta e os parâmetros que satisfazem o modelo são encontrados por análise, para fornecer a relação exata.
• A regressão linear é realizada para variáveis quantitativas, e a função resultante é uma variável quantitativa..
• Na regressão logística, os dados utilizados podem ser categóricos ou quantitativos, mas o resultado é sempre categórico.