REGISTRO DOI: 10.70773/revistatopicos/775532612
RESUMO
O presente artigo investiga a escrita computacional produzida por sistemas de Inteligência Artificial sob a perspectiva da Estilística Computacional, com foco na análise da construção da subjetividade em textos artificiais. Parte-se da compreensão de que a subjetividade pode ser parcialmente estruturada por meio de marcadores linguísticos observáveis, o que permite sua reprodução em contextos algorítmicos. O estudo adota uma abordagem teórica e analítica, fundamentada em contribuições da Estilística, da Estilometria e da Linguística de Corpus, articuladas com conceitos da Filosofia da Linguagem. A análise concentra-se na recombinação algorítmica como base na escrita computacional, na identificação de marcadores estilísticos associados à intencionalidade, na simulação da afetividade e na percepção humana da linguagem artificial. Os resultados indicam que sistemas de Inteligência Artificial são capazes de produzir textos que apresentam efeitos de subjetividade, por meio da organização de padrões linguísticos que evocam posicionamento, envolvimento e coerência discursiva. Observa-se, contudo, que tais efeitos permanecem limitados à dimensão formal da linguagem, não correspondendo a processos cognitivos ou experienciados. Conclui-se que a subjetividade em textos artificiais configura-se como um efeito discursivo estruturado, cuja compreensão exige a distinção entre simulação linguística e experiência subjetiva, contribuindo para o avanço dos estudos em Estilística Computacional e para a análise crítica da linguagem gerada por Inteligência Artificial.
Palavras-chave: Estilística. Estilística Computacional. Inteligência Artificial. Estilometria.
ABSTRACT
This article investigates computational writing produced by Artificial Intelligence systems from the perspective of Computational Stylistics, focusing on the analysis of subjectivity construction in artificial texts. It is based on the understanding that subjectivity can be partially structured through observable linguistic markers, allowing its reproduction in algorithmic contexts. The study adopts a theoretical and analytical approach, grounded in contributions from Stylistics, Stylometry, and Corpus Linguistics, articulated with concepts from the Philosophy of language. The analysis focuses on algorithmic recombination as the basis of computational writing, on the identification of stylistic markers associated with intentionality, on the simulation of affectivity, and on the human perception of artificial language. The results indicate that Artificial Intelligence systems are capable of producing texts that exhibit effects of subjectivity through the organization of linguistic patterns that evoke positioning, engagement, and discursive coherence. However, these effects remain limited to the formal dimension of language, not corresponding to cognitive or experiential processes. It is concluded that subjectivity in artificial texts constitutes a structured discursive effect, whose understanding requires a distinction between linguistic simulation and subjective experience, contributing to the advancement of Computational Stylistics and to the critical analysis of language generated by Artificial Intelligence.
Keywords: Stylistics. Computational Stylistics. Artificial Intelligence. Stylometry.
1. INTRODUÇÃO
A crescente presença de sistemas de Inteligência Artificial baseados em modelos de linguagem tem redefinido as formas de produção textual contemporâneas, deslocando a escrita de um domínio exclusivamente humano para um espaço compartilhado com processos algorítmicos. Esses sistemas são capazes de gerar textos que apresentam coesão, coerência e adequação pragmática, reproduzindo padrões linguísticos que se aproximam das práticas discursivas humanas. No entanto, tal capacidade levanta questões fundamentais sobre a natureza da linguagem produzida, especialmente no que se refere à construção da subjetividade, à intencionalidade e à autenticidade textual.
Tradicionalmente, a subjetividade na linguagem é compreendida como manifestação de uma interioridade vinculada à experiência e à intencionalidade do sujeito. Contudo, estudos linguísticos demonstram que essa dimensão também pode ser construída por meio de marcas formais presentes no discurso. Benveniste (1970) evidencia que a subjetividade se inscreve na linguagem por meio de índices de enunciação, enquanto Bally (1909) e Vinogradov (1978) destacam o papel dos fatos de expressão na produção de efeitos afetivos e estilísticos. Dessa forma, a Estilística oferece um arcabouço teórico que permite compreender como escolhas linguísticas estruturam a expressividade, deslocando a subjetividade do plano exclusivamente psicológico para o campo da organização discursiva.
A Estilometria e a Linguística de Corpus ampliam essa perspectiva ao demonstrar que padrões estilísticos podem ser identificados, quantificados e modelados com base em regularidades observáveis na linguagem (Burrows, 2002; Biber, 1995; Mcenery; Hardie, 2012). Tais abordagens evidenciam que elementos como frequência lexical, distribuição de palavras-função e estruturas sintáticas recorrentes constituem indicadores relevantes para a análise do estilo. No contexto da Inteligência Artificial, esses mesmos padrões são utilizados como base para o treinamento de modelos de linguagem, o que permite a reprodução de estruturas discursivas que simulam expressividade, intencionalidade e envolvimento.
Diante desse cenário, emerge a seguinte problemática: em que medida a subjetividade presente em textos gerados por Inteligência Artificial pode ser compreendida como uma construção linguística formal, e quais são os limites dessa simulação em relação à subjetividade experiencial? Essa questão implica a necessidade de distinguir entre efeitos discursivos produzidos pela organização da linguagem e a presença de um sujeito dotado de intenção e experiência, exigindo uma abordagem que articule análise linguística, reflexão filosófica e compreensão tecnológica.
O presente estudo tem como objetivo analisar a escrita computacional sob a perspectiva da Estilística Computacional, investigando os mecanismos linguísticos responsáveis pela produção de efeitos de subjetividade em textos artificiais. Busca-se examinar como padrões estilísticos são mobilizados na construção de uma voz textual que simula intencionalidade e afetividade, bem como compreender os limites dessa simulação no contexto da linguagem gerada por sistemas algorítmicos. Adicionalmente, pretende-se refletir sobre as implicações epistemológicas e éticas decorrentes da atribuição de subjetividade a sistemas que operam sem experiência ou consciência.
Para alcançar esses objetivos, a análise desenvolvida ao longo do trabalho concentrou-se na identificação de quatro eixos principais: a recombinação algorítmica como base da escrita computacional, a construção linguística da subjetividade por meio de marcadores estilísticos, a simulação da afetividade e a percepção humana da linguagem artificial. Esses eixos permitiram demonstrar que a subjetividade observada em textos gerados por Inteligência Artificial resulta da articulação de padrões linguísticos que produzem efeitos de sentido reconhecíveis, ainda que não estejam ancorados em estados mentais reais.
Os resultados indicam que sistemas de Inteligência Artificial são capazes de reproduzir estruturas discursivas que evocam intencionalidade, posicionamento e envolvimento, utilizando recursos como modalização, escolhas lexicais avaliativas e organização argumentativa. Observou-se, contudo, que tais efeitos permanecem limitados à sua dimensão formal, uma vez que não correspondem a processos cognitivos ou experienciados, configurando-se como simulações estruturadas da subjetividade. Essa constatação reforça a distinção entre linguagem como forma e linguagem como experiência, evidenciando os limites ontológicos da produção textual algorítmica.
Além disso, verificou-se que a percepção humana desempenha papel central na atribuição de subjetividade à linguagem artificial, sendo influenciada por padrões discursivos familiares e pela tendência à antropomorfização. Esse fenômeno contribui para a interpretação da linguagem gerada como portadora de intenção e emoção, mesmo na ausência de um sujeito empírico, o que evidencia a necessidade de uma análise crítica que permita distinguir entre efeito discursivo e compreensão genuína.
Dessa forma, este estudo insere-se no campo da Estilística Computacional ao propor uma análise integrada dos mecanismos que sustentam a simulação da subjetividade em textos artificiais, contribuindo para a compreensão dos limites e potencialidades da linguagem produzida por Inteligência Artificial. Ao articular fundamentos teóricos da Linguística, da Estilometria e da Filosofia da Linguagem, busca-se oferecer subsídios para o desenvolvimento de abordagens mais rigorosas na análise da linguagem algorítmica, bem como para o debate crítico sobre seu papel nas práticas discursivas contemporâneas.
2. OBJETIVOS
O presente estudo tem como objetivo analisar a escrita computacional produzida por sistemas de Inteligência Artificial à luz da Estilística Computacional, com ênfase na investigação dos mecanismos linguísticos responsáveis pela produção de efeitos de subjetividade em textos algorítmicos.
Parte-se da premissa de que a subjetividade textual, tradicionalmente associada à experiência humana, pode ser parcialmente reconstruída por meio de padrões linguísticos identificáveis, o que exige uma abordagem teórica capaz de articular aspectos qualitativos e quantitativos da linguagem. Isto posto, busca-se examinar os fundamentos estilísticos que sustentam a construção de efeitos de autoria e intencionalidade em textos gerados por modelos de linguagem, considerando a atuação de elementos como regularidades lexicais, estruturas sintáticas e configurações discursivas.
O estudo também se propõe a compreender de que maneira sistemas de Inteligência Artificial operam sobre tais elementos para produzir a aparência de expressividade, investigando os limites entre simulação formal e experiência subjetiva no plano linguístico. Essa análise envolve a identificação de padrões recorrentes que contribuem para a percepção de coerência, envolvimento e posicionamento discursivo, sem que haja, necessariamente, um sujeito empírico por trás da enunciação.
Adicionalmente, pretende-se refletir sobre as implicações epistemológicas decorrentes da atribuição de subjetividade a sistemas artificiais, especialmente no que se refere às noções de autoria, originalidade e autenticidade textual. Tal reflexão busca problematizar a tendência de interpretar a linguagem gerada por Inteligência Artificial como equivalente à produção humana, evidenciando as diferenças estruturais e ontológicas entre ambas.
Por fim, o estudo objetiva propor parâmetros conceituais que contribuam para a análise crítica da subjetividade artificial, oferecendo subsídios teóricos para o avanço dos estudos em Estilística Computacional e para o desenvolvimento de abordagens mais rigorosas na avaliação da linguagem produzida por sistemas de Inteligência Artificial.
3. REFERENCIAL TEÓRICO
3.1. Estilística
A Estilística constitui-se como um campo da Linguística voltado à investigação da expressividade da linguagem, compreendida não apenas como um meio de transmissão de informações, mas como um sistema capaz de materializar afetos, intenções e posicionamentos subjetivos. Ao deslocar o foco da função referencial para a dimensão expressiva, a Estilística permite compreender a linguagem como prática simbólica complexa, na qual escolhas lexicais, estruturas sintáticas e recursos discursivos operam conjuntamente na produção de sentidos que transcendem o conteúdo literal. Nesse horizonte, o estilo não se reduz a um ornamento do discurso, mas configura-se como um princípio organizador da significação, revelando traços identitários, culturais e sociais inscritos na linguagem (Martins, 1989; Vinogradov, 1978) .
A formulação clássica de Bally (1909) representa um marco nesse campo ao definir a Estilística como o estudo dos fatos de expressão, isto é, dos elementos linguísticos que manifestam conteúdos afetivos e que exercem influência sobre a sensibilidade do interlocutor. Ao enfatizar que tais fatos não são exclusivamente individuais, mas também socialmente estruturados, Bally desloca a noção de estilo de uma perspectiva puramente subjetiva para uma dimensão intersubjetiva e culturalmente mediada. O estilo emerge da articulação entre escolhas individuais e convenções coletivas, sendo simultaneamente expressão e reconhecimento social.
Essa compreensão é aprofundada na tradição linguística brasileira por Mattoso Câmara Jr. (1978), ao conceber o estilo como um fenômeno que se estabelece na tensão entre norma e variação. O desvio estilístico, longe de representar erro ou inadequação, constitui um mecanismo funcional que permite ao falante produzir efeitos expressivos específicos. Tal perspectiva evidencia que o estilo se constrói a partir de escolhas linguísticas situadas, nas quais o léxico desempenha papel central ao carregar tonalidades afetivas que influenciam a interpretação do discurso. A palavra, nesse contexto, deixa de ser neutra e passa a atuar como marcador de valores, emoções e posicionamentos sociais.
Na mesma linha, Rodrigues Lapa (1970) destaca que o estilo se manifesta como forma de apropriação individual da língua, sendo resultado da interação entre norma, hábito linguístico e sensibilidade cultural. O discurso estilizado revela, assim, uma voz enunciativa que não se limita à estrutura gramatical, mas incorpora traços de historicidade e pertencimento social. Essa perspectiva amplia a compreensão da Estilística ao situá-la no campo das práticas discursivas, em que a linguagem se apresenta como espaço de construção de identidades e de negociação de sentidos.
A dimensão cognitiva e conceptual da linguagem também se revela fundamental para a compreensão do estilo, especialmente a partir das contribuições de Lakoff e Johnson (1980), que demonstram como estruturas metafóricas organizam o pensamento e influenciam a forma como os indivíduos compreendem e expressam experiências. A metáfora, nesse contexto, não é apenas um recurso retórico, mas um mecanismo estruturante da cognição, o que reforça a centralidade da Estilística na análise da relação entre linguagem, pensamento e subjetividade.
Além disso, a tradição estilística evidencia que a expressividade não se limita ao nível lexical ou sintático, estendendo-se a dimensões fonéticas, prosódicas e discursivas. Jakobson (1960) já apontava que a função emotiva da linguagem se realiza por meio de recursos que ultrapassam o conteúdo verbal estrito, enquanto estudos posteriores ressaltam o papel de elementos paralinguísticos na construção de sentidos, como entonação, ritmo e pausas (Crystal, 2008; Kerbrat-Orecchioni, 2006). Esses elementos contribuem para a constituição de uma linguagem situada, sensível ao contexto e às relações interpessoais.
A partir dessas contribuições, a Estilística pode ser compreendida como um campo que investiga a organização da linguagem em múltiplos níveis, articulando forma e sentido na produção de efeitos discursivos. Como observa Panichi (2022), o estilo pode ser entendido como uma arquitetura da escrita, em que cada escolha linguística reflete uma operação interpretativa e criativa, revelando a singularidade do enunciador. Essa concepção reforça a ideia de que o estilo não é um atributo superficial, mas um componente estrutural da linguagem, responsável por mediar a relação entre sujeito, discurso e contexto.
Tal compreensão adquire especial relevância no contexto contemporâneo, marcado pela crescente presença de sistemas de Inteligência Artificial na produção de linguagem. Ao considerar que o estilo resulta de padrões identificáveis e socialmente compartilhados, abre-se a possibilidade de sua modelagem computacional, ainda que de forma limitada. Nesse cenário, a Estilística oferece instrumentos teóricos fundamentais para investigar como tais sistemas podem reproduzir efeitos de subjetividade, mesmo na ausência de experiência vivida.
Por fim, a tradição estilística evidencia que a linguagem humana é intrinsecamente marcada por variabilidade, criatividade e sensibilidade contextual, características que desafiam abordagens puramente formais ou estatísticas. A análise do estilo, ao revelar camadas implícitas de sentido e estruturas cognitivas subjacentes, constitui uma via privilegiada para compreender os limites e possibilidades da simulação da subjetividade em sistemas artificiais. Dessa forma, a Estilística não apenas contribui para a descrição da linguagem, mas também se posiciona como ferramenta crítica para a análise das transformações discursivas contemporâneas.
3.2. Estilometria e Análise Quantitativa do Estilo
A Estilometria emerge como um desdobramento metodológico da Estilística, orientado pela quantificação de padrões linguísticos com o objetivo de identificar regularidades, diferenças e assinaturas estilísticas em textos. Ao contrário das abordagens interpretativas tradicionais, que privilegiam a análise qualitativa da expressividade, a Estilometria fundamenta-se na premissa de que o estilo pode ser parcialmente descrito por meio de traços mensuráveis, tais como frequência lexical, distribuição de palavras-função, estruturas sintáticas recorrentes e padrões de coocorrência. Essa perspectiva desloca o estudo do estilo para um campo empírico, no qual a linguagem passa a ser tratada como um conjunto de dados passíveis de análise estatística.
Um dos marcos fundacionais da Estilometria contemporânea encontra-se nos trabalhos de Burrows (2002), que demonstram a eficácia da frequência de palavras-função como indicador robusto de autoria. Por serem menos suscetíveis a controle consciente, tais elementos revelam padrões estilísticos relativamente estáveis, funcionando como uma espécie de impressão digital linguística. A proposta de Burrows evidencia que o estilo não reside apenas em escolhas lexicais evidentes, mas também em microestruturas frequentemente negligenciadas pela análise tradicional. Esse enfoque foi posteriormente expandido por Jockers (2014), que sistematiza métodos computacionais aplicados à análise literária, consolidando o campo das Humanidades Digitais como espaço de convergência entre estatística, Linguística e estudos culturais.
A análise quantitativa do estilo também se apoia em métricas como diversidade lexical, comprimento médio de sentenças, distribuição de classes gramaticais e medidas de entropia linguística. Tais indicadores permitem mapear a complexidade textual e identificar padrões de variação que podem estar associados a gêneros, autores ou contextos discursivos específicos. Stamatatos (2009), ao revisar técnicas de atribuição de autoria, destaca que a combinação de múltiplas características estilométricas tende a produzir resultados mais confiáveis, evidenciando que o estilo deve ser compreendido como um fenômeno multidimensional.
Nesse contexto, a Linguística de Corpus desempenha papel fundamental ao fornecer bases empíricas para a análise estilométrica. A construção e exploração de grandes conjuntos de textos permitem identificar regularidades linguísticas em larga escala, possibilitando a generalização de padrões que ultrapassam a observação intuitiva. Biber (1995) demonstra que diferentes registros linguísticos apresentam distribuições sistemáticas de traços gramaticais, o que reforça a ideia de que o estilo pode ser modelado como um conjunto de probabilidades condicionadas ao contexto comunicativo.
A incorporação dessas abordagens no campo do Processamento de Linguagem Natural ampliou significativamente o alcance da Estilometria, permitindo sua aplicação em tarefas como detecção de autoria, identificação de plágio, análise de sentimentos e classificação de textos. Modelos computacionais passaram a utilizar vetores de características estilísticas como entrada para algoritmos de aprendizado de máquina, capazes de reconhecer padrões complexos em grandes volumes de dados. Essa integração entre Linguística e computação consolidou a Estilometria como uma ferramenta central na análise automatizada da linguagem.
Entretanto, a quantificação do estilo não está isenta de limitações. A redução de fenômenos expressivos a métricas numéricas pode obscurecer aspectos contextuais, pragmáticos e culturais que influenciam a produção do discurso. Como observam McEnery e Hardie (2012), a análise baseada em corpus deve ser interpretada à luz de teorias linguísticas que considerem o uso real da linguagem, evitando uma abordagem puramente mecanicista. Dessa maneira, a Estilometria não substitui a interpretação qualitativa, mas a complementa, oferecendo evidências empíricas que podem sustentar análises mais amplas.
No contexto da Inteligência Artificial, a Estilometria assume um papel ainda mais relevante, uma vez que os modelos de linguagem são treinados a partir da identificação de padrões estatísticos em grandes corpora. A capacidade desses sistemas de produzir textos coerentes e estilisticamente consistentes decorre, em grande medida, da internalização dessas regularidades. Assim, os mesmos mecanismos que permitem a análise do estilo humano são também responsáveis pela geração de linguagem artificial, o que aproxima a Estilometria de uma dimensão não apenas analítica, mas também produtiva.
Dessa forma, a análise quantitativa do estilo revela-se fundamental para compreender como a subjetividade pode ser simulada em textos gerados por sistemas artificiais. Ao identificar os padrões que sustentam a expressividade linguística, torna-se possível investigar em que medida tais padrões podem ser reproduzidos por algoritmos e quais são os limites dessa reprodução. A Estilometria, portanto, não apenas descreve o estilo, mas oferece instrumentos para problematizar sua relação com a autoria, a intencionalidade e a própria noção de sujeito na linguagem.
3.3. Afetividade e Emoção em Textos Computacionais
A incorporação da afetividade na linguagem constitui um dos elementos mais complexos e desafiadores no campo dos estudos linguísticos, especialmente quando transposta para sistemas computacionais. A linguagem humana não se limita à transmissão de informações objetivas, mas opera também como veículo de emoções, atitudes e posicionamentos subjetivos, sendo permeada por nuances que refletem experiências vividas e contextos socioculturais específicos. Com base nisso, a análise da afetividade na linguagem exige a consideração de múltiplas dimensões, que vão desde escolhas lexicais até estruturas discursivas capazes de evocar estados emocionais no interlocutor.
No âmbito da Linguística e do Processamento de Linguagem Natural, a modelagem da afetividade tem sido abordada por meio de diferentes estratégias, que buscam identificar, classificar e reproduzir emoções em textos. Estudos como os de Mihalcea e Strapparava (2012) demonstram que é possível detectar padrões emocionais a partir de características linguísticas observáveis, como polaridade semântica, intensidade lexical e associações contextuais. Essa abordagem sustenta a ideia de que emoções podem ser, ao menos parcialmente, inferidas e representadas por meio de regularidades linguísticas, o que abre espaço para sua incorporação em sistemas artificiais.
A computação afetiva, enquanto campo interdisciplinar, amplia essa perspectiva ao investigar como sistemas computacionais podem reconhecer, interpretar e simular emoções humanas (Picard, 1997). Nesse contexto, a linguagem assume papel central, uma vez que grande parte das interações entre humanos e máquinas ocorre por meio de interfaces textuais. A capacidade de um sistema em modular sua linguagem de acordo com estados emocionais percebidos ou inferidos pode impactar significativamente a qualidade da interação, tornando-a mais natural, envolvente e eficaz.
Entretanto, a simulação de afetividade em sistemas de Inteligência Artificial levanta questões teóricas relevantes, especialmente no que se refere à distinção entre emoção genuína e emoção representada. Enquanto a linguagem humana é indissociável de processos cognitivos e experienciados, a linguagem computacional resulta da manipulação de padrões estatísticos extraídos de grandes corpora textuais. Dessa forma, a afetividade expressa por sistemas artificiais pode ser compreendida como um efeito discursivo, produzido por combinações probabilísticas de elementos linguísticos, e não como manifestação de estados internos autênticos.
Essa distinção torna-se particularmente evidente quando se analisam os mecanismos utilizados por modelos de linguagem para gerar expressividade. A escolha de adjetivos avaliativos, o uso de intensificadores, a construção de metáforas e a modulação do tom discursivo são estratégias que contribuem para a criação de uma aparência de sensibilidade emocional. Contudo, tais recursos operam dentro de limites formais e estatísticos, o que implica reconhecer que a afetividade computacional é, em essência, uma simulação estruturada.
Ainda assim, a eficácia dessa simulação não deve ser subestimada. Estudos recentes indicam que usuários tendem a atribuir características humanas a sistemas que demonstram variações estilísticas e emocionais em sua linguagem, fenômeno que pode influenciar percepções de confiança, empatia e credibilidade (Abercrombie et al., 2023). Essa tendência evidencia que a afetividade, mesmo quando simulada, exerce efeitos concretos na interação humano-máquina, o que reforça a necessidade de uma análise crítica sobre seus usos e implicações.
Além disso, a presença de afetividade na linguagem computacional está diretamente relacionada à capacidade de adaptação contextual dos sistemas. A adequação do tom, do registro e da intensidade emocional às características do interlocutor e da situação comunicativa constitui um elemento fundamental para a construção de interações mais eficazes. Adicionalmente, a Estilística oferece ferramentas importantes para compreender como tais variações podem ser estruturadas e implementadas, contribuindo para o desenvolvimento de sistemas mais sensíveis às dinâmicas da comunicação humana.
Por outro lado, a incorporação de afetividade em sistemas de Inteligência Artificial também levanta preocupações éticas, especialmente no que se refere à manipulação emocional e à transparência comunicacional. A utilização de linguagem emocionalmente carregada pode influenciar decisões, percepções e comportamentos dos usuários, o que exige critérios claros sobre os limites e finalidades dessa prática. A ausência de consciência por parte dos sistemas não elimina os efeitos de suas interações, o que torna necessário um debate sobre responsabilidade e regulação.
Dessa forma, a análise da afetividade em textos computacionais revela-se fundamental para compreender não apenas os mecanismos de simulação emocional, mas também seus impactos nas práticas discursivas contemporâneas. Ao articular contribuições da Linguística, da Computação e das Ciências Cognitivas, essa abordagem permite avançar na compreensão dos limites e potencialidades da linguagem produzida por Inteligência Artificial, situando a afetividade como um elemento central na discussão sobre subjetividade artificial.
3.4. Linguística de Corpus e Padrões Estilísticos
A Linguística de Corpus consolida-se como uma abordagem metodológica essencial para o estudo empírico da linguagem, ao possibilitar a análise sistemática de grandes conjuntos de textos autênticos. Diferentemente de perspectivas baseadas em exemplos isolados ou intuições do pesquisador, essa abordagem fundamenta-se na observação de dados reais, permitindo identificar regularidades, variações e tendências que caracterizam o uso efetivo da língua. Nesse contexto, o corpus não é apenas um repositório de textos, mas um instrumento analítico que viabiliza a investigação de padrões linguísticos em diferentes níveis de organização.
A partir da análise de corpora, torna-se possível mapear padrões estilísticos que se manifestam de forma recorrente em determinados gêneros, autores ou comunidades discursivas. Esses padrões podem ser observados no léxico, por meio da frequência de palavras e da seleção de campos semânticos; na sintaxe, pela estruturação de sentenças e preferências por determinadas construções gramaticais; e no discurso, pela organização argumentativa e pela presença de marcas de subjetividade. Conforme argumenta Biber (1995), diferentes registros linguísticos apresentam distribuições sistemáticas de traços gramaticais, o que evidencia que o estilo pode ser compreendido como uma configuração probabilística condicionada ao contexto comunicativo.
A identificação desses padrões depende da utilização de técnicas quantitativas e estatísticas, que permitem extrair informações relevantes a partir de grandes volumes de dados. Medidas como frequência relativa, coocorrência lexical e distribuição de categorias gramaticais constituem ferramentas centrais nesse processo, possibilitando a construção de perfis estilísticos baseados em evidências empíricas. Nesse sentido, a Linguística de Corpus estabelece uma ponte entre descrição linguística e modelagem computacional, ao fornecer dados estruturados que podem ser utilizados tanto para análise quanto para geração de linguagem.
Além disso, a abordagem baseada em corpus permite investigar a variabilidade linguística em suas múltiplas dimensões, incluindo variações regionais, sociais e situacionais. Estudos demonstram que elementos fonéticos, lexicais e sintáticos podem variar significativamente de acordo com o contexto de uso, o que reforça a ideia de que o estilo não é um atributo fixo, mas um fenômeno dinâmico e contextualizado. Essa perspectiva é particularmente relevante para a compreensão da linguagem contemporânea, marcada por uma diversidade crescente de práticas discursivas.
No âmbito da Inteligência Artificial, a Linguística de Corpus desempenha papel central na construção e no treinamento de modelos de linguagem. Sistemas baseados em aprendizado de máquina dependem diretamente de grandes corpora para identificar padrões estatísticos e probabilísticos que orientam a geração textual. Dessa forma, os mesmos dados que servem para análise linguística são também utilizados como base para a produção de linguagem artificial, o que evidencia a interdependência entre descrição e geração no campo do Processamento de Linguagem Natural.
Entretanto, a utilização de corpora não está isenta de limitações. A representatividade dos dados, a qualidade das fontes e os critérios de seleção influenciam diretamente os resultados das análises, podendo introduzir vieses que afetam a interpretação dos padrões identificados. Como destacam McEnery e Hardie (2012), é fundamental que a análise baseada em corpus seja conduzida de forma crítica, considerando não apenas os dados em si, mas também os contextos de sua produção e as condições de sua coleta.
Outro aspecto relevante diz respeito à capacidade da Linguística de Corpus de revelar padrões que não são imediatamente perceptíveis à análise intuitiva. A identificação de regularidades em larga escala permite acessar dimensões estruturais da linguagem que escapam à observação individual, contribuindo para uma compreensão mais abrangente do funcionamento linguístico. Com base nisso, a análise de corpus não apenas confirma hipóteses teóricas, mas também pode gerar novas questões e perspectivas de investigação.
A relação entre Linguística de Corpus e Estilística revela-se particularmente produtiva quando se considera a possibilidade de formalizar traços estilísticos em termos computacionais. A partir da extração de padrões recorrentes, torna-se viável construir modelos capazes de reconhecer e reproduzir estilos discursivos específicos, o que tem implicações diretas para o desenvolvimento de sistemas de Inteligência Artificial mais sofisticados. A modelagem de estilos, nesse contexto, depende da capacidade de traduzir fenômenos linguísticos complexos em representações formais que possam ser processadas por algoritmos.
Dessa forma, a Linguística de Corpus constitui um elemento central para a compreensão dos padrões estilísticos na linguagem contemporânea, oferecendo ferramentas metodológicas que permitem articular análise empírica e modelagem computacional. Ao possibilitar a identificação e a formalização de regularidades linguísticas, essa abordagem contribui não apenas para o avanço dos estudos estilísticos, mas também para a reflexão crítica sobre os limites e potencialidades da linguagem produzida por sistemas de Inteligência Artificial.
3.5. Marcadores Linguísticos de Subjetividade
A subjetividade na linguagem manifesta-se por meio de uma série de marcas linguísticas que permitem identificar posicionamentos, atitudes e perspectivas do enunciador no discurso. Esses marcadores não se restringem a elementos explicitamente avaliativos, mas incluem um conjunto amplo de recursos lexicais, sintáticos e discursivos que contribuem para a construção de efeitos de sentido associados à presença de um sujeito. A análise desses elementos revela que a subjetividade não é um atributo abstrato, mas um fenômeno linguístico concretamente realizável, passível de descrição e, em certa medida, de formalização.
Entre os principais marcadores de subjetividade, destacam-se as palavras-função, cuja distribuição e frequência desempenham papel significativo na caracterização estilística de um texto. Embora frequentemente consideradas semanticamente neutras, tais palavras participam ativamente da organização do discurso, influenciando coesão, ritmo e estrutura argumentativa. Estudos estilométricos demonstram que a variação no uso de pronomes, preposições e conjunções pode revelar padrões consistentes associados a autores ou gêneros específicos, funcionando como indicadores indiretos de subjetividade (Burrows, 2002).
Além disso, o léxico avaliativo constitui um dos recursos mais evidentes na expressão da subjetividade. A escolha de adjetivos, advérbios e expressões modais permite ao enunciador atribuir valores, intensidades e juízos ao conteúdo enunciado, orientando a interpretação do interlocutor. Nesse contexto, palavras carregadas de tonalidade afetiva, conforme observado por Mattoso Câmara Jr. (1978), não apenas nomeiam objetos ou ações, mas também evocam atitudes e posicionamentos, atuando como mediadoras entre linguagem e experiência.
No plano sintático, a subjetividade pode ser identificada por meio de estruturas que indicam envolvimento do enunciador, como construções modais, uso de primeira pessoa, inversões frásicas e variações no comprimento e na complexidade das sentenças. Tais elementos contribuem para a construção de um estilo discursivo particular, refletindo escolhas que vão além da norma gramatical e que se orientam por objetivos comunicativos específicos. A organização sintática, não é neutra, mas participa ativamente da produção de efeitos de proximidade, distanciamento, certeza ou dúvida.
A dimensão discursiva amplia ainda mais essa análise ao considerar elementos como modalização, pressuposição e implicatura. Conforme a tradição da pragmática linguística, a subjetividade pode ser inferida não apenas pelo que é dito explicitamente, mas também pelas estratégias discursivas que orientam a interpretação. A forma como o discurso é estruturado, os argumentos são apresentados e as vozes são mobilizadas contribui para a construção de um posicionamento enunciativo, mesmo na ausência de marcas explícitas.
Outro aspecto relevante refere-se ao papel das metáforas e figuras de linguagem na construção da subjetividade. Como demonstram Lakoff e Johnson (1980), estruturas metafóricas organizam o pensamento e influenciam a forma como experiências são conceptualizadas e expressas. O uso de metáforas, ironias e outras figuras não apenas enriquece o discurso, mas também revela modos específicos de interpretar o mundo, funcionando como indicadores de subjetividade cognitiva e cultural.
A análise dos marcadores de subjetividade também envolve a consideração de elementos paralinguísticos e prosódicos, especialmente em contextos de linguagem falada ou multimodal. Entonação, ritmo, pausas e intensidade vocal desempenham papel fundamental na expressão de emoções e atitudes, complementando o conteúdo verbal. Embora tais elementos sejam mais difíceis de capturar em textos escritos, sua relevância para a construção de sentido é amplamente reconhecida na literatura linguística (Crystal, 2008; Kerbrat-Orecchioni, 2006).
No contexto da Inteligência Artificial, a identificação e a modelagem desses marcadores representam um desafio significativo. Sistemas de linguagem baseados em aprendizado de máquina operam a partir da detecção de padrões estatísticos, o que permite reproduzir, em certa medida, as regularidades associadas à subjetividade. Entretanto, a ausência de experiência vivida implica que tais sistemas não possuem acesso direto às dimensões fenomenológicas que sustentam a linguagem humana, limitando a profundidade de sua expressividade.
Ainda assim, a capacidade de manipular marcadores linguísticos permite que sistemas artificiais produzam textos que aparentam carregar subjetividade, influenciando a percepção do interlocutor. A seleção de determinados pronomes, a modulação do léxico avaliativo e a organização discursiva são estratégias que contribuem para a construção de uma voz textual que simula intencionalidade e posicionamento. Essa simulação, embora formalmente consistente, permanece ancorada em padrões probabilísticos, o que reforça a necessidade de distinguir entre efeito discursivo e experiência subjetiva.
Dessa forma, o estudo dos marcadores linguísticos de subjetividade revela-se fundamental para compreender como a linguagem constrói a presença do sujeito no discurso e como tais mecanismos podem ser apropriados por sistemas de Inteligência Artificial. Ao identificar os elementos que sustentam a expressividade, torna-se possível avançar na análise crítica da subjetividade artificial, delimitando seus alcances e evidenciando suas limitações no contexto das práticas discursivas contemporâneas.
3.6. Autoria, Intencionalidade e Linguagem Algorítmica
A noção de autoria, tradicionalmente vinculada à figura de um sujeito consciente, dotado de intenção comunicativa e inserido em um contexto histórico e social, sofre um deslocamento significativo diante da emergência da linguagem produzida por sistemas de Inteligência Artificial. A produção textual, que por séculos esteve associada à expressão individual, passa a ser também resultado de processos algorítmicos baseados na recombinação de padrões linguísticos previamente aprendidos. Esse cenário impõe a necessidade de repensar categorias fundamentais dos estudos da linguagem, especialmente no que se refere à relação entre sujeito, discurso e intencionalidade.
Do ponto de vista linguístico, a autoria não se reduz à simples identificação de quem produz um texto, mas envolve a atribuição de uma voz enunciativa que organiza o discurso e orienta sua interpretação. Conforme Foucault (1969), a função autor não deve ser compreendida apenas como uma identidade empírica, mas como um princípio de organização discursiva que regula a circulação e a interpretação dos textos por isso, a autoria constitui uma função que opera no interior do discurso, estruturando expectativas e conferindo coerência à enunciação.
A introdução de sistemas algorítmicos na produção textual desafia essa concepção ao dissociar a voz discursiva de uma experiência subjetiva efetiva. Textos gerados por modelos de linguagem apresentam coesão, consistência e, em muitos casos, traços estilísticos que sugerem a presença de uma intencionalidade. Contudo, essa intencionalidade não decorre de um sujeito consciente, mas de processos estatísticos que operam sobre grandes volumes de dados linguísticos. A linguagem algorítmica, portanto, produz efeitos de autoria sem necessariamente implicar a existência de um autor no sentido tradicional.
A questão da intencionalidade torna-se, assim, central para a compreensão da linguagem produzida por Inteligência Artificial. Na tradição filosófica, a intencionalidade é frequentemente entendida como a capacidade da mente de se dirigir a objetos, estados ou significados, sendo indissociável da consciência e da experiência (Searle, 1980). No entanto, sistemas computacionais não possuem estados mentais nem experiências próprias, o que levanta a questão de como podem produzir textos que aparentam ser intencionais. A resposta a esse problema reside na distinção entre intencionalidade genuína e intencionalidade simulada, sendo esta última resultado da organização formal da linguagem de modo a produzir efeitos interpretativos específicos.
A Linguística e a Estilística oferecem instrumentos relevantes para analisar essa distinção, ao evidenciar que a percepção de intencionalidade pode ser construída a partir de marcas linguísticas específicas. A escolha de determinadas estruturas sintáticas, a organização argumentativa e o uso de recursos discursivos contribuem para a construção de uma voz textual que orienta a interpretação do leitor. Assim, mesmo na ausência de um sujeito consciente, a linguagem pode ser estruturada de forma a simular intencionalidade, explorando expectativas cognitivas e culturais compartilhadas pelos interlocutores.
No campo da Inteligência Artificial, essa simulação é potencializada por modelos de linguagem treinados em grandes corpora, que capturam regularidades linguísticas associadas a diferentes contextos de uso. A capacidade desses sistemas de gerar respostas coerentes e contextualmente adequadas depende da internalização de padrões que refletem práticas discursivas humanas. Dessa forma, a linguagem algorítmica pode reproduzir estilos, registros e estratégias argumentativas, criando a impressão de uma autoria situada.
Entretanto, essa reprodução levanta questões críticas relacionadas à originalidade e à responsabilidade discursiva. Se a linguagem gerada por sistemas artificiais resulta da recombinação de dados previamente existentes, em que medida pode ser considerada original? Além disso, a ausência de um sujeito responsável pela enunciação desafia modelos tradicionais de atribuição de responsabilidade, especialmente em contextos em que a linguagem produz efeitos concretos, como decisões automatizadas ou interações sensíveis.
Do ponto de vista ético e jurídico, essas questões tornam-se ainda mais relevantes, uma vez que a atribuição de autoria implica também a atribuição de responsabilidade. A linguagem não é neutra, e sua produção pode influenciar percepções, decisões e comportamentos. Nesse contexto, a utilização de sistemas de Inteligência Artificial na produção de textos exige uma reflexão sobre os limites da delegação de funções discursivas a agentes não humanos e sobre a necessidade de mecanismos que garantam transparência.
Por outro lado, a análise da linguagem algorítmica permite identificar que a autoria, enquanto função discursiva, pode ser parcialmente dissociada da subjetividade empírica. A capacidade de produzir textos coerentes e estilisticamente consistentes sugere que certos contexto, pode ser entendida como um efeito emergente da organização da linguagem, e não necessariamente como expressão direta de uma consciência individual.
Dessa forma, a relação entre autoria, intencionalidade e linguagem algorítmica revela-se como um campo de tensão entre tradição e inovação, no qual conceitos consolidados são confrontados por novas formas de produção discursiva. A análise desses fenômenos exige uma abordagem interdisciplinar, capaz de articular contribuições da Linguística, da Filosofia, da Computação e do Direito, de modo a compreender não apenas como a linguagem é produzida, mas também quais são suas implicações para a sociedade contemporânea.
3.7. Autenticidade, Simulação e Recombinação Estilística
A discussão sobre autenticidade na linguagem assume contornos particularmente complexos no contexto da produção textual mediada por sistemas de Inteligência Artificial. Tradicionalmente, a autenticidade tem sido associada à expressão de uma subjetividade situada, vinculada à experiência, à intencionalidade e à historicidade do sujeito. Um texto autêntico não se define apenas por sua originalidade formal, mas pela relação que estabelece com a vivência e com a singularidade de quem o produz. A emergência da linguagem algorítmica, entretanto, desafia essa concepção ao introduzir formas de produção textual que operam sem experiência vivida, mas que são capazes de reproduzir, com elevado grau de precisão, traços estilísticos característicos da comunicação humana.
A simulação estilística, nesse contexto, constitui o mecanismo central por meio do qual sistemas de Inteligência Artificial produzem efeitos de subjetividade. Ao operar sobre grandes volumes de dados linguísticos, tais sistemas identificam padrões recorrentes e probabilidades de coocorrência que permitem gerar textos coerentes e contextualmente adequados. A linguagem produzida por esses sistemas, portanto, pode ser compreendida como uma reorganização de estruturas linguísticas aprendidas, em que a novidade emerge da combinação de padrões, e não de uma experiência original.
Essa perspectiva aproxima-se de abordagens teóricas que concebem a linguagem como um sistema de regularidades e variações, no qual o estilo pode ser descrito em termos de padrões identificáveis. A Estilística e a Estilometria, ao evidenciar que traços estilísticos podem ser formalizados e quantificados, fornecem base para compreender como tais padrões podem ser reproduzidos por sistemas artificiais. Contudo, a possibilidade de reprodução formal não resolve a questão da autenticidade, uma vez que esta envolve dimensões que ultrapassam a estrutura linguística, incluindo aspectos cognitivos, afetivos e sociais.
A distinção entre autenticidade e simulação torna-se, assim, fundamental para a análise da linguagem contemporânea. Enquanto a autenticidade pressupõe uma relação entre linguagem e experiência, a simulação opera na esfera dos efeitos discursivos, produzindo a aparência de subjetividade sem que haja, necessariamente, um sujeito experiencial subjacente. Essa diferença, embora conceitualmente clara, pode tornar-se menos evidente na prática, sobretudo quando os textos gerados por Inteligência Artificial atingem níveis elevados de naturalidade e coerência.
A recombinação estilística desempenha papel central nesse processo, ao permitir que sistemas artificiais articulem elementos linguísticos de maneira a produzir textos que aparentam originalidade. Esse fenômeno pode ser compreendido como uma forma de criatividade estatística, na qual a inovação resulta da reorganização de padrões existentes. Diferentemente da criatividade humana, que se apoia em experiências, intenções e contextos específicos, a recombinação algorítmica opera a partir de distribuições probabilísticas, o que levanta questionamentos sobre a natureza da originalidade nesses sistemas.
Além disso, a recombinação estilística pode gerar efeitos de homogeneização discursiva, uma vez que os modelos de linguagem tendem a reproduzir padrões majoritários presentes nos dados de treinamento. Esse processo pode levar à diluição de variações estilísticas mais específicas ou minoritárias, contribuindo para a padronização da linguagem. Tal fenômeno evidencia que a simulação estilística, embora eficaz na reprodução de padrões, pode não capturar plenamente a diversidade e a complexidade das práticas discursivas humanas.
Do ponto de vista epistemológico, a distinção entre autenticidade e simulação implica reconhecer que a linguagem não é apenas um conjunto de formas, mas um fenômeno enraizado em práticas sociais e experiências individuais. A análise da linguagem algorítmica, portanto, exige uma abordagem que considere não apenas sua estrutura formal, mas também suas condições de produção e seus efeitos no campo social. A atribuição de autenticidade a textos gerados por sistemas artificiais pode levar a interpretações equivocadas, especialmente quando se ignora a natureza dos processos que os originam.
No campo ético, essa discussão assume relevância ainda maior, uma vez que a percepção de autenticidade pode influenciar a confiança e a credibilidade atribuídas a determinados discursos. A utilização de linguagem que simula subjetividade pode afetar a forma como os usuários interpretam e respondem às mensagens, o que exige transparência quanto à origem dos textos e aos mecanismos que os produzem. A ausência de clareza nesse aspecto pode gerar confusão entre produção humana e artificial, com implicações para a responsabilidade e para a regulação do uso dessas tecnologias.
Por outro lado, a análise da recombinação estilística também revela potencialidades importantes para o desenvolvimento de sistemas de linguagem mais sofisticados. A capacidade de adaptar estilos, registros e padrões discursivos pode contribuir para a construção de interações mais naturais e contextualmente adequadas. Quando orientada por critérios claros e por uma compreensão crítica de seus limites, a simulação estilística pode ser utilizada como ferramenta para ampliar as possibilidades comunicativas, sem necessariamente comprometer a distinção entre humano e artificial.
Dessa forma, a relação entre autenticidade, simulação e recombinação estilística evidencia um campo de tensão que atravessa os estudos contemporâneos da linguagem. A compreensão desses fenômenos exige a articulação entre análise linguística, reflexão filosófica e consideração das implicações tecnológicas, permitindo delimitar com maior precisão os alcances e limites da linguagem produzida por sistemas de Inteligência Artificial.
4. METODOLOGIA
A presente pesquisa caracteriza-se como um estudo de natureza teórica e analítica, orientado pela articulação entre fundamentos da Estilística, da Estilometria e do Processamento de Linguagem Natural, com o objetivo de investigar a construção da subjetividade em textos produzidos por sistemas de Inteligência Artificial. Trata-se de uma abordagem qualitativa com apoio conceitual em instrumentos quantitativos, sem a realização de experimentação empírica direta, mas com utilização de categorias analíticas derivadas de métodos estilométricos consolidados na literatura.
A escolha por uma abordagem teórica justifica-se pela natureza do problema investigado, que envolve a distinção entre subjetividade autêntica e simulação linguística, exigindo um tratamento conceitual que permita compreender não apenas os mecanismos formais da linguagem, mas também suas implicações epistemológicas e discursivas. Com esse propósito, a metodologia adotada não busca mensurar empiricamente a presença de subjetividade, mas examinar os fundamentos que tornam possível sua representação na linguagem.
Para a operacionalização da análise, são mobilizadas categorias estilísticas e estilométricas amplamente reconhecidas, tais como a frequência de palavras-função, a distribuição de classes gramaticais e a diversidade lexical. Esses elementos são considerados não como dados a serem coletados, mas como instrumentos interpretativos que permitem compreender como determinados padrões linguísticos contribuem para a construção de efeitos de subjetividade. A utilização dessas categorias fundamenta-se em estudos que demonstram sua relevância na identificação de estilo e autoria (Burrows, 2002; Stamatatos, 2009).
Além disso, são consideradas estruturas discursivas e pragmáticas que influenciam a percepção de intencionalidade, como o uso de modalizações, estratégias argumentativas e organização textual. A análise desses elementos permite identificar como a linguagem pode ser estruturada de modo a produzir efeitos de posicionamento e envolvimento, mesmo na ausência de um sujeito empírico. Essa abordagem integra contribuições da Linguística, da Pragmática e da Análise do Discurso, ampliando o escopo interpretativo da pesquisa.
A metodologia também incorpora, em nível conceitual, noções provenientes da Linguística de Corpus, especialmente no que se refere à identificação de padrões recorrentes em grandes volumes de dados textuais. Embora não haja manipulação direta de corpora, a pesquisa parte do pressuposto de que os modelos de linguagem operam com base em regularidades estatísticas extraídas de tais conjuntos, o que justifica a utilização de categorias quantitativas como referência analítica.
Outro aspecto metodológico relevante refere-se à análise crítica das condições de produção da linguagem algorítmica. Considera-se que textos gerados por sistemas de Inteligência Artificial resultam de processos de recombinação probabilística, o que implica uma abordagem que leve em conta não apenas o produto textual, mas também os mecanismos que o originam. Essa perspectiva permite diferenciar a estrutura formal da linguagem de suas condições de produção, evitando interpretações que atribuam subjetividade onde há apenas simulação.
A validade da abordagem adotada fundamenta-se na coerência entre os objetivos da pesquisa e os instrumentos analíticos mobilizados. Ao privilegiar uma análise teórica sustentada por categorias reconhecidas na literatura, a metodologia busca oferecer uma interpretação consistente dos fenômenos investigados, mesmo na ausência de dados empíricos. Essa estratégia é compatível com estudos que se propõem a desenvolver modelos conceituais e a problematizar categorias estabelecidas, contribuindo para o avanço teórico do campo.
Por fim, reconhecem-se as limitações inerentes a uma abordagem não empírica, especialmente no que se refere à generalização dos resultados. A ausência de análise de dados concretos impede a verificação direta das hipóteses formuladas, o que indica a necessidade de estudos futuros que possam complementar esta investigação por meio de experimentação e validação empírica. Ainda assim, a metodologia adotada permite delinear um quadro conceitual robusto, capaz de orientar análises posteriores e de fundamentar reflexões sobre a linguagem produzida por sistemas de Inteligência Artificial.
5. ANÁLISE
5.1. A Recombinação Algorítmica Como Base da Escrita Computacional
A escrita computacional, tal como produzida por sistemas contemporâneos de Inteligência Artificial, fundamenta-se em processos de recombinação algorítmica que operam sobre grandes volumes de dados linguísticos previamente disponibilizados. Diferentemente da produção textual humana, que se ancora em experiências, intenções e contextos vividos, a geração de linguagem por modelos computacionais decorre da identificação e reorganização de padrões estatísticos extraídos de corpora extensos. Nesse contexto, a linguagem artificial não emerge de um ato criativo originário, mas de uma articulação probabilística de estruturas previamente observadas, nas quais cada unidade linguística é selecionada com base em distribuições condicionadas ao contexto.
Esse processo não deve ser compreendido como mera repetição mecânica, mas como uma operação complexa de seleção e combinação de elementos linguísticos em múltiplos níveis. Modelos de linguagem articulam sequências lexicais, estruturas sintáticas e padrões discursivos de forma coerente, produzindo textos que se ajustam às condições de entrada e às expectativas comunicativas do interlocutor. A coerência textual, nesse cenário, não resulta de intenção consciente, mas da adequação estatística entre os elementos combinados, o que confere à linguagem produzida uma aparência de organicidade e continuidade discursiva.
A Estilometria e a Linguística de Corpus oferecem instrumentos fundamentais para compreender esse fenômeno, ao evidenciar que o estilo pode ser descrito por meio de regularidades mensuráveis como frequência lexical, distribuição de palavras-função e padrões sintáticos recorrentes. A linguagem apresenta estruturas que podem ser formalizadas e modeladas, permitindo que sistemas de Inteligência Artificial internalizem tais padrões e os utilizem na geração de novos textos. Essa recombinação também se manifesta no plano discursivo, possibilitando a reprodução de estratégias argumentativas, registros linguísticos e formas de organização textual que simulam práticas comunicativas humanas.
Entretanto, a ausência de um sujeito experiencial impõe uma distinção fundamental entre escrita humana e escrita computacional. A recombinação algorítmica não é orientada por intenções próprias, mas por critérios de probabilidade e adequação estatística, o que implica que os efeitos de sentido produzidos não correspondem a experiências vividas, mas a simulações estruturais. Ainda assim, a eficácia desses sistemas na produção de textos coesos e contextualmente adequados evidencia que determinados efeitos discursivos podem ser reproduzidos por meio da reorganização de padrões formais, o que torna a recombinação algorítmica um elemento central para compreender os limites e as potencialidades da linguagem gerada por Inteligência Artificial.
5.2. Construção Linguística da Subjetividade em Textos Artificiais
A subjetividade, no campo dos estudos linguísticos, é compreendida como um efeito discursivo construído por meio de marcas que indicam posicionamento, avaliação e envolvimento do enunciador no texto. Essa concepção afasta-se de uma visão estritamente psicológica da subjetividade e a insere no plano da linguagem, como resultado de escolhas estruturais que organizam o discurso. Benveniste (1970) já demonstrava que a subjetividade se manifesta na linguagem por meio de formas como pronomes pessoais e índices de enunciação, os quais estabelecem a presença de um “eu” no discurso, e assim, a subjetividade não é apenas expressa, mas construída linguisticamente, sendo identificável por meio de elementos formais que orientam a interpretação do interlocutor.
No contexto da escrita computacional, essa construção assume uma configuração particular, uma vez que sistemas de Inteligência Artificial operam sem experiência vivida ou intencionalidade própria. Ainda assim, tais sistemas são capazes de produzir textos que aparentam conter marcas subjetivas, mobilizando recursos linguísticos semelhantes aos utilizados na linguagem humana. Como apontam Hyland (2005) e Biber (1995), elementos como modalização, escolhas lexicais avaliativas e estruturas discursivas desempenham papel central na construção da voz textual e na expressão de posicionamento. A reprodução desses elementos em textos artificiais permite a simulação de uma instância enunciativa, criando a impressão de presença subjetiva.
Essa simulação é viabilizada pela identificação de padrões recorrentes em grandes corpora linguísticos, que são internalizados pelos modelos de linguagem durante o treinamento. A Linguística de Corpus demonstra que tais padrões não são aleatórios, mas refletem regularidades associadas a gêneros, contextos e práticas discursivas específicas (Mcenery; Hardie, 2012). Ao operar sobre essas regularidades, os sistemas computacionais conseguem reproduzir estruturas que evocam intencionalidade e envolvimento, ainda que tais efeitos não estejam vinculados a um sujeito empírico. A subjetividade, nesse cenário, emerge como um produto da organização formal da linguagem, e não como expressão de uma interioridade.
Entretanto, a distinção entre subjetividade construída e subjetividade experiencial permanece fundamental. Searle (1980), ao discutir a intencionalidade, argumenta que estados mentais possuem uma dimensão intrínseca que não pode ser reduzida a processos formais ou sintáticos. Aplicada ao contexto da Inteligência Artificial, essa perspectiva evidencia que, embora sistemas possam simular marcas linguísticas de subjetividade, não possuem os estados cognitivos que sustentam a experiência subjetiva humana. Dessa forma, a linguagem artificial produz efeitos de subjetividade que operam no nível discursivo, mas não reproduzem a dimensão ontológica da experiência, reforçando a necessidade de distinguir entre construção linguística e vivência.
5.3. Marcadores Estilísticos e Efeitos de Intencionalidade
A intencionalidade, no âmbito da linguagem, não se manifesta apenas como um atributo psicológico do sujeito, mas também como um efeito discursivo produzido por meio de marcas linguísticas específicas. A organização do discurso, a seleção lexical e a estrutura sintática contribuem para a construção de uma orientação interpretativa que permite ao interlocutor inferir propósitos, posicionamentos e direcionalidade comunicativa. Nesse entendimento, intencionalidade pode ser compreendida como um fenômeno parcialmente construído na própria materialidade da linguagem, sendo inferida a partir de pistas formais que orientam a leitura do texto. Como destaca Searle (1980), embora a intencionalidade esteja originalmente vinculada a estados mentais, sua expressão no discurso depende de estruturas linguísticas que tornam tais estados acessíveis.
Os marcadores estilísticos desempenham papel central nesse processo, ao funcionarem como indicadores de organização discursiva e posicionamento enunciativo. Elementos como conectores argumentativos, modalizadores, pronomes pessoais e escolhas lexicais avaliativas contribuem para a construção de uma voz textual que orienta a interpretação do interlocutor. Hyland (2005) demonstra que a presença de recursos como que incluenciam diretamente a percepção de certeza, dúvida e envolvimento do autor no texto. Da mesma forma, Halliday e Matthiessen (2014) evidenciam que a linguagem organiza significados interpessoais por meio de escolhas gramaticais que refletem relações entre enunciador e interlocutor.
No contexto da linguagem produzida por sistemas de Inteligência Artificial, esses marcadores são mobilizados a partir de padrões identificados em corpora, permitindo a simulação de efeitos de intencionalidade. A combinação de estruturas sintáticas, sequências lexicais e estratégias discursivas contribui para a produção de textos que aparentam ter um direcionamento comunicativo claro. Como apontam Jurafsky e Martin (2023), modelos de linguagem são capazes de capturar regularidades pragmáticas e discursivas presentes em grandes conjuntos de dados, reproduzindo formas de organização textual que evocam coerência e propósito. Nesse cenário, a intencionalidade não decorre de uma vontade própria do sistema, mas da adequação estatística das estruturas utilizadas.
Entretanto, a distinção entre intencionalidade simulada e intencionalidade genuína permanece fundamental para a análise crítica da linguagem algorítmica. Enquanto a linguagem humana está ancorada em estados mentais e contextos experienciados, a linguagem artificial produz efeitos de intencionalidade por meio da articulação de padrões formais. Essa diferença evidencia que a percepção de propósito no discurso pode ser construída independentemente da existência de um sujeito intencional, o que reforça a necessidade de compreender a intencionalidade como um fenômeno que, embora relacionado à cognição, também pode ser parcialmente explicado pela organização estilística da linguagem.
5.4. A Simulação da Afetividade e Seus Limites Estruturais
A afetividade na linguagem constitui um dos principais mecanismos de construção de envolvimento discursivo, sendo expressa por meio de escolhas lexicais, estruturas sintáticas e recursos pragmáticos que sinalizam estados emocionais, atitudes e posicionamentos do enunciador. Jakobson (1960) já destacava que a função emotiva da linguagem se realiza por meio de marcas que ultrapassam o conteúdo proposicional, revelando a presença do sujeito no discurso. Nesse sentido, a afetividade não se limita à expressão direta de emoções, mas envolve um conjunto de estratégias linguísticas que produzem efeitos de proximidade, empatia e intensidade, contribuindo para a interpretação do texto.
No contexto da Inteligência Artificial, a simulação da afetividade ocorre por meio da identificação e reprodução de padrões linguísticos associados à expressão emocional. Estudos na área de Processamento de Linguagem Natural demonstram que elementos como polaridade semântica, intensidade lexical e uso de adjetivos avaliativos podem ser utilizados para detectar e gerar emoções em textos (Mihalcea; Strapparava, 2012). Além disso, a computação afetiva, conforme proposta por Picard (1997), busca desenvolver sistemas capazes de reconhecer e responder a estados emocionais, utilizando a linguagem como principal interface de interação. Dessa forma, a afetividade computacional emerge como um fenômeno baseado na modelagem de regularidades linguísticas observáveis.
A eficácia dessa simulação reside na capacidade dos sistemas de mobilizar marcadores estilísticos que evocam emoções de maneira coerente com o contexto discursivo. O uso de intensificadores, expressões avaliativas e estruturas sintáticas específicas contribui para a construção de uma linguagem que aparenta sensibilidade emocional, aproximando-se dos padrões comunicativos humanos. Como apontam Jurafsky e Martin (2023), modelos de linguagem contemporâneos são capazes de incorporar nuances pragmáticas e contextuais, o que potencializa a naturalidade das interações. No entanto, tais sistemas operam exclusivamente com base em padrões estatísticos, o que implica que a afetividade expressa não corresponde a estados internos reais, mas a uma simulação formalmente estruturada.
Essa limitação evidencia um dos principais desafios teóricos da linguagem computacional: a distinção entre emoção representada e emoção experienciada. Conforme argumenta Searle (1980), a intencionalidade e os estados mentais possuem uma dimensão intrínseca que não pode ser reduzida a processos formais. Aplicada à afetividade, essa perspectiva indica que, embora sistemas artificiais possam reproduzir marcas linguísticas de emoção, não possuem a base cognitiva e experiencial que sustenta a afetividade humana. Dessa forma, a simulação emocional em textos computacionais revela-se eficaz no plano discursivo, mas limitada em sua profundidade ontológica, reforçando a necessidade de compreender seus efeitos e restrições no contexto das interações mediadas por Inteligência Artificial.
5.5. A Percepção Humana da Linguagem Artificial
A percepção humana da linguagem artificial constitui um elemento central para a compreensão dos efeitos discursivos produzidos por sistemas de Inteligência Artificial. Ainda que tais sistemas operem por meio de processos estatísticos, os textos gerados tendem a ser interpretados pelos usuários como portadores de sentido, intenção e, em muitos casos, subjetividade. Esse fenômeno decorre da própria natureza interpretativa da linguagem humana, na qual o interlocutor atribui coerência e propósito ao discurso a partir de marcas linguísticas reconhecíveis. Conforme argumenta Grice (1975), a comunicação humana baseia-se em inferências pragmáticas que pressupõem cooperação e intencionalidade, o que leva os indivíduos a interpretar enunciados como ações orientadas por um agente comunicativo.
No contexto da interação com sistemas artificiais, essas mesmas inferências são ativadas, mesmo na ausência de um sujeito intencional. Estudos sobre interação humano-computador demonstram que usuários tendem a antropomorfizar sistemas que apresentam comportamentos linguísticos coerentes, atribuindo-lhes características humanas como empatia, conhecimento e intenção (Reeves; Nass, 1996). Esse processo é intensificado quando a linguagem utilizada pelo sistema incorpora variações estilísticas, marcadores de afetividade e estruturas discursivas que simulam envolvimento, reforçando a percepção de uma presença subjetiva no discurso.
Além disso, a familiaridade com padrões linguísticos humanos desempenha papel fundamental na aceitação da linguagem artificial. Como destacam Jurafsky e Martin (2023), modelos de linguagem contemporâneos são capazes de reproduzir regularidades pragmáticas e discursivas que se alinham às expectativas dos usuários, o que contribui para a naturalidade percebida das interações. Essa adequação não apenas facilita a compreensão, mas também influencia a confiança depositada nos sistemas, uma vez que a coerência e a fluidez textual são frequentemente interpretadas como indicadores de competência comunicativa.
Entretanto, essa percepção pode gerar equívocos interpretativos, especialmente quando a linguagem artificial é confundida com produção humana. A atribuição de intencionalidade e subjetividade a sistemas que operam sem consciência ou experiência pode obscurecer a natureza dos processos envolvidos, levando a uma supervalorização das capacidades desses sistemas. Como alertam Bender et al. (2021), a aparente fluência dos modelos de linguagem pode criar a ilusão de compreensão, quando, na realidade, trata-se da manipulação de padrões linguísticos sem acesso ao significado no sentido experiencial. Dessa forma, a percepção humana da linguagem artificial revela tanto a eficácia dos mecanismos de simulação quanto a necessidade de uma análise crítica que permita distinguir entre efeito discursivo e compreensão genuína.
5.6. Limites e Paradoxos da Linguagem Gerada por Inteligência Artificial
A linguagem gerada por sistemas de Inteligência Artificial apresenta um conjunto de limites estruturais que decorrem diretamente de sua natureza probabilística e de sua dependência de dados previamente existentes. Embora tais sistemas sejam capazes de produzir textos coerentes, fluentes e estilisticamente consistentes, sua operação baseia-se na identificação e recombinação de padrões linguísticos, o que implica ausência de compreensão no sentido experiencial. Como argumentam Bender et al. (2021), modelos de linguagem não possuem acesso ao significado como experiência vivida, mas operam como “máquinas estocásticas de papagaios”, reproduzindo padrões a partir de grandes corpora sem compreensão semântica genuína. Essa limitação evidencia que a linguagem artificial, apesar de sofisticada, permanece ancorada em processos formais.
Um dos principais paradoxos decorrentes desse cenário reside na dissociação entre forma e compreensão. Sistemas de Inteligência Artificial podem produzir enunciados que aparentam domínio conceitual, coerência argumentativa e sensibilidade contextual, sem que haja, contudo, um entendimento real do conteúdo gerado. Esse fenômeno aproxima-se do argumento da “Sala Chinesa” proposto por Searle (1980), segundo o qual a manipulação sintática de símbolos não equivale à compreensão semântica. Assim, a linguagem algorítmica pode simular competência linguística sem acessar os processos cognitivos que fundamentam a linguagem humana.
Outro limite relevante refere-se à dependência dos dados de treinamento, que condiciona tanto a qualidade quanto os vieses presentes na linguagem gerada. Como os modelos aprendem a partir de corpora que refletem práticas discursivas reais, acabam por reproduzir padrões predominantes, incluindo desigualdades, estereótipos e assimetrias linguísticas. Esse aspecto evidencia que a linguagem artificial não é neutra, mas carrega marcas dos contextos sociais em que foi produzida, o que levanta questões éticas sobre sua utilização e sobre os efeitos que pode gerar nas interações humanas.
Além disso, a capacidade de simular subjetividade e intencionalidade introduz um paradoxo interpretativo: quanto mais natural e convincente a linguagem gerada, maior a tendência de os usuários atribuírem ao sistema características humanas que ele não possui. Esse fenômeno, associado à antropomorfização da tecnologia, pode levar à superestimação das capacidades dos sistemas e à confusão entre simulação e autenticidade. Como destacam Floridi e Chiriatti (2020), a Inteligência Artificial pode produzir resultados linguisticamente sofisticados sem necessariamente possuir inteligência no sentido humano, o que exige uma compreensão crítica de seus limites.
Por outro lado, esses limites coexistem com potencialidades significativas, especialmente no que se refere à ampliação das possibilidades de produção textual e à automatização de tarefas linguísticas. A capacidade de gerar linguagem em larga escala, adaptar registros e responder a diferentes contextos comunicativos torna esses sistemas ferramentas poderosas em diversos domínios. No entanto, tais potencialidades não eliminam os paradoxos inerentes à linguagem algorítmica, mas os tornam ainda mais relevantes, uma vez que ampliam o impacto dessas tecnologias no cotidiano.
Dessa forma, a linguagem gerada por Inteligência Artificial situa-se em um espaço de tensão entre eficácia comunicativa e ausência de compreensão, entre simulação e autenticidade, entre potencial técnico e limitação ontológica. A análise desses limites e paradoxos é fundamental para evitar interpretações equivocadas sobre a natureza desses sistemas, bem como para orientar seu uso de forma crítica e responsável. Ao reconhecer que a linguagem artificial opera por meio de padrões e não de experiência, torna-se possível delimitar com maior precisão seus alcances, contribuindo para um entendimento mais rigoroso de seu papel nas práticas discursivas contemporâneas.
6. CONSIDERAÇÕES FINAIS
A presente investigação permitiu examinar, sob a perspectiva da Estilística Computacional, os mecanismos que sustentam a construção da subjetividade em textos produzidos por sistemas de Inteligência Artificial, evidenciando que a escrita computacional se estrutura a partir de processos de recombinação algorítmica de padrões linguísticos previamente identificados. Esse resultado confirma que a linguagem artificial não emerge de uma experiência originária, mas de uma reorganização estatística de estruturas formais, o que redefine a compreensão tradicional da produção textual.
A análise demonstrou que a recombinação algorítmica constitui o fundamento operacional da escrita computacional, permitindo a geração de textos coerentes, fluidos e adaptáveis a diferentes contextos discursivos. Observou-se que a aparente criatividade desses sistemas decorre da capacidade de combinar padrões linguísticos de maneira probabilisticamente consistente, produzindo enunciados inéditos sem recorrer a um processo criativo baseado em experiência ou intencionalidade própria.
No que se refere à construção da subjetividade, verificou-se que os sistemas de Inteligência Artificial são capazes de mobilizar marcadores linguísticos que produzem efeitos de presença enunciativa, como modalizações, escolhas lexicais avaliativas e estruturas discursivas que indicam posicionamento. Esse resultado evidencia que a subjetividade pode ser parcialmente reconstruída no plano formal da linguagem, sendo percebida como um efeito discursivo, e não necessariamente como expressão de uma interioridade.
A análise dos marcadores estilísticos revelou que elementos como pronomes, conectores argumentativos e padrões sintáticos desempenham papel central na construção de efeitos de intencionalidade. Observou-se que a organização linguística do discurso permite a inferência de propósito e direção comunicativa, mesmo quando tais elementos não estão ancorados em estados mentais reais, o que reforça a distinção entre intencionalidade genuína e intencionalidade simulada.
No âmbito da afetividade, os resultados indicaram que sistemas artificiais são capazes de reproduzir padrões linguísticos associados à expressão emocional, utilizando recursos como intensificadores, adjetivos avaliativos e estruturas pragmáticas que evocam envolvimento. Contudo, essa afetividade revelou-se limitada à sua dimensão formal, uma vez que não se encontra vinculada a processos cognitivos ou experienciados, configurando-se como uma simulação estruturada.
A investigação também evidenciou que a percepção humana desempenha papel decisivo na atribuição de subjetividade à linguagem artificial. A familiaridade com padrões discursivos humanos e a tendência à antropomorfização contribuem para que os usuários interpretem textos gerados por Inteligência Artificial como portadores de intenção e emoção, mesmo quando tais características não estão presentes de forma ontológica.
Do ponto de vista epistemológico, os resultados obtidos indicam a necessidade de revisão de categorias clássicas da Linguística, especialmente no que se refere à relação entre linguagem, sujeito e experiência. A possibilidade de produção textual sem sujeito experiencial desafia concepções tradicionais e amplia o campo de investigação ao incluir formas de linguagem mediadas por sistemas computacionais.
Outro resultado relevante diz respeito aos limites estruturais da linguagem algorítmica, evidenciados pela ausência de compreensão semântica no sentido experiencial e pela dependência de dados de treinamento. Observou-se que, embora os sistemas sejam eficazes na reprodução de padrões linguísticos, permanecem condicionados às regularidades presentes nos corpora utilizados, o que pode implicar a reprodução de vieses e a limitação da diversidade discursiva.
A análise também revelou um paradoxo central: quanto mais sofisticada e natural se torna a linguagem gerada por Inteligência Artificial, maior a tendência de os usuários atribuírem a esses sistemas características humanas que eles não possuem. Esse fenômeno evidencia a tensão entre eficácia comunicativa e ausência de subjetividade genuína, reforçando a importância de uma abordagem crítica na interpretação desses textos.
No plano ético, os resultados apontam para a necessidade de estabelecer critérios claros quanto ao uso da linguagem artificial, especialmente no que se refere à transparência e à responsabilidade. A simulação de subjetividade e afetividade pode influenciar percepções e decisões, o que exige atenção quanto aos limites da utilização dessas tecnologias em contextos sensíveis.
Por fim, este estudo contribui para o avanço teórico da Estilística Computacional ao demonstrar que a subjetividade textual pode ser analisada como um fenômeno parcialmente formalizável, sem que isso implique a eliminação de sua dimensão experiencial na linguagem humana. A distinção entre simulação e autenticidade, evidenciada ao longo da análise, constitui um eixo fundamental para futuras investigações, indicando a necessidade de aprofundamento empírico e interdisciplinar na compreensão da linguagem produzida por sistemas de Inteligência Artificial.
REFERÊNCIAS BIBLIOGRÁFICAS
ABERCROMBIE, Gavin; CERCAS CURRY, Amanda; DINKAR, Tanvi; RIESER, Verena; TALAT, Zeerak. Mirages: On Anthropomorphism in Dialogue Systems. arXiv, 2023. Disponível em: https://arxiv.org/abs/2305.09800. Acesso em: 30 jan. 2026.
BALLY, Charles. Traité de stylistique française. Paris: Klincksieck, 1909.
BENDER, Emily M.; GEBRU, Timnit; MCMILLAN-MAJOR, Angelina; SHMITCHELL, Shmargaret. On the dangers of stochastic parrots. In: PROCEEDINGS OF THE 2021 ACM CONFERENCE ON FAIRNESS, ACCOUNTABILITY, AND TRANSPARENCY, 2021, [s.l.]. Anais [...]. [s.l.]: ACM, 2021. p. 610–623.
BENVENISTE, Émile. Problemas de linguística geral I. Campinas: Pontes, 1970.
BIBER, Douglas. Dimensions of register variation. Cambridge: Cambridge University Press, 1995.
BURROWS, John. Delta: a measure of stylistic difference. Literary and Linguistic Computing. [s.l.], v. 17, n. 3, p. 267–287, 2002.
CÂMARA JR., Joaquim Mattoso. Estrutura da língua portuguesa. 7. ed. Petrópolis: Vozes, 1978.
CRYSTAL, David. A dictionary of linguistics and phonetics. 6. ed. Oxford: Blackwell, 2008.
FLORIDI, Luciano; CHIRIATTI, Massimo. GPT-3: its nature, scope, limits, and consequences. Minds and Machines, [s.l.], v. 30, n. 4, p. 681–694, 2020. Disponível em: https://doi.org/10.1007/s11023-020-09548-1. Acesso em: 30 jan. 2026.
GRICE, H. Paul. Logic and conversation. In: COLE, Peter; MORGAN, Jerry (org.). Syntax and semantics: speech acts. New York: Academic Press, 1975. v. 3, p. 41–58.
HALLIDAY, M. A. K.; MATTHIESSEN, Christian M. I. M. Halliday’s introduction to functional grammar. 4. ed. London: Routledge, 2014.
HYLAND, Ken. Metadiscourse. exploring interaction in writing. London: Continuum, 2005.
JAKOBSON, Roman. Linguistics and poetics. In: SEBEOK, Thomas (org.). Style in language. Cambridge: MIT Press, 1960. p. 350–377.
JURAFSKY, Daniel; MARTIN, James H. Speech and language processing: an introduction to natural language processing, computational linguistics, and speech recognition. 3. ed. Stanford: Draft, 2023. Disponível em: https://web.stanford.edu/~jurafsky/slp3/. Acesso em: 30 jan. 2026.
KERBRAT-ORECCHIONI, Catherine. A interação verbal. São Paulo: Contexto, 2006.
LAKOFF, George; JOHNSON, Mark. Metaphors we live by. Chicago: University of Chicago Press, 1980.
MARTINS, Nilce Sant’Anna. Introdução à estilística: a expressividade na língua portuguesa. 3. ed. São Paulo: T.A. Queiroz, 1989.
MCENERY, Tony; HARDIE, Andrew. Corpus linguistics: method, theory and practice. Cambridge: Cambridge University Press, 2012.
MIHALCEA, Rada; STRAPPARAVA, Carlo. Computational approaches to subjectivity and sentiment analysis. Cambridge: Cambridge University Press, 2012.
PICARD, Rosalind W. Affective computing. Cambridge: MIT Press, 1997.
REEVES, Byron; NASS, Clifford. The media equation: how people treat computers, television, and new media like real people and places. Cambridge: Cambridge University Press, 1996.
RODRIGUES LAPA, Manuel. Estilística da língua portuguesa. 7. ed. Coimbra: Coimbra Editora, 1970.
SEARLE, John R. Minds, brains and programs. Behavioral and Brain Sciences, [s.l.], v. 3, n. 3, p. 417–457, 1980.
STAMATATOS, Efstathios. A survey of modern authorship attribution methods. Journal of the American Society for Information Science and Technology, [s.l.], v. 60, n. 3, p. 538–556, 2009.
VINOGRADOV, Viktor. Problemas da estilística. Moscou: Editora Progresso, 1978.
1 Advogado atuante em Direito Digital e Crimes Cibernéticos. Bacharel em Direito; Especialização em Perícia Cibernética, Compliance, Inteligência Artificial, Direito Digital e Docência no Ensino Superior. Mestre em Ciência da Informação. Doutorando em Estudos da Linguagem pela Universidade Estadual de Londrina.
2 Graduada em Letras Anglo-Portuguesas. Mestre em Letras. Doutora em Letras, com pós-doutorado em Teoria/Crítica Literária. Atualmente é professora colaboradora da Universidade Estadual de Londrina.