We are a group of Georgetown University faculty, student, and staff researchers at the intersection of language and computation. Our areas of expertise include natural language processing, corpus linguistics, information retrieval, text mining, and more, with participation from both the Linguistics and Computer Science departments.

GU research groups: Corpling, NERT, IRLab, InfoSense, Singh lab

Other GU groups: GU-HLT Group, GU Women Coders, Massive Data Institute, Tech & Society Initiative

Related academic groups in the DC/Baltimore region: Howard NLP, JHU CLSP, UMD CLIP, George Mason NLP

News & Media

6/12/25: How Georgetown Linguists, Legal Expert Scored a Win in Supreme Court ‘Ghost Guns’ Case (Kevin Tobia, Nathan Schneider, Brandon Waldon)
9/8/21: Congratulations to the Corpling lab on winning the DISRPT 2021 shared task on discourse processing!
8/27/20: First-Year Student Presented Paper at Prestigious Computational Linguistics Conference (Aryaman Arora)
9/10/18: #MeToo Movement on Twitter (Lisa Singh)
8/29/18: Cliches in baseball (Nathan Schneider)
1/20/18: The Coptic Scriptorium project (Amir Zeldes)
Congratulations to Arman Cohan, Nazli Goharian, and Georgetown alum Andrew Yates for winning a Best Long Paper award at EMNLP 2017!
Congratulations to Ophir Frieder, who has been named to the European Academy of Sciences and Arts (EASA)!
9/19/16: "Email" Dominates What Americans Have Heard About Clinton (Lisa Singh)
7/12/16: Searching Harsh Environments (Ophir Frieder)

Mailing list: Contact Nathan Schneider to subscribe!

upcoming talks/events

Maciej Ogrodniczuk (IPI PAN Warsaw): Linguistics, 9/6/24, 3:30 in Poulton 230
Alexis Palmer (Colorado Boulder): Linguistics, 9/20/24, 3:30 in Poulton 230
Barbara Plank (LMU Munich): CS, Thurs. 10/10/24, 1:00 in STM 414
Eugene Yang (JHU): CS, 11/1/24, 12:15 in STM 107
Kyle Mahowald (UT Austin): Linguistics, 11/1/24, 3:30 in Poulton 230
Linguistics Career Mixer, 3/19/25, 5:30 in Poulton Hall
William Schuler (OSU): Linguistics, 3/21/25, 3:30 in Poulton 230
Emily Pace: Linguistics Career Talk, 3/26/25, 3:30 in Poulton 230
Sorelle Friedler (Haverford College): CS, 4/4/25, 11:00 in room TBA
Ellie Pavlick (Brown): Linguistics, 4/4/25, ~~3:30~~ 1:30 in Poulton 230
Ziyu Yao (GMU): CS, 4/11/25, 11:30 in room TBA
Ethan Wilcox (Georgetown): Cognitive Science, 4/25/25, 1:00 in Leavey Conference Center Salon B
Sarah Mess, MD (JHU Hospital): Linguistics, 4/25/25, 3:30 in Poulton 230
Tom McCoy (Yale): Linguistics, 6/13/25, 2:00 in Poulton 230
Previous talks

People

	Amro Abdalla Ph.D. student, CS multimodal learning, vision and language, explainable AI
	Trevor Adriaanse Adjunct Lecturer / Department of Defense (and MS alum) CL & NLP
	Mohamed Ahmed Ph.D. student, CS deep learning, NLP, explainable AI
	Chloe Anderson Undergraduate, CS & Linguistics major machine learning, AI research, AI safety
	Tatsuya Aoyama Ph.D. student, Linguistics NLP, corpus linguistics, SLA, interlanguage
	Le Bao Postdoctoral Fellow, Massive Data Institute machine learning, Bayesian statistics, survey methodology
	Sarah Adel Bargal Assistant Professor, CS deep learning, vision and language, explainable AI
	Austin Blodgett Adjunct Lecturer / Researcher at U.S. Army Research Laboratory (and Ph.D. alum) CL & NLP, computational semantics, mathematical approaches to linguistics
	Claire Bonial Adjunct Lecturer / Researcher at U.S. Army Research Laboratory computational semantics, human-robot dialogue, construction grammar, semantic world modeling and reasoning
	Lanni Bu MS student, Linguistics CL & NLP, computational psycholinguistics, language processing, corpus linguistics
	Mikayla Campbell MS student, Linguistics NLP, language preservation & revitalization, language data sovereignty
	Rui Chen MS student, CS NLP, deep learning, data analytics
	Victor De Lima Ph.D. student, CS machine learning, agent-based information retrieval, conversational agents
	Dan DeGenaro MS student, Linguistics computational sociolinguistics, models of language change and variation, low-resource languages and varieties, AI ethics
	Sibo Dong Ph.D. student, CS deep learning, information retrieval, NLP, deep reinforcement learning
	Lillian Ehrhart MS student, Linguistics CL & NLP, multilingual NLP, machine translation
	Ophir Frieder Professor, CS & Georgetown Medical Center information retrieval, text mining, bioinformatics, wireless networks
	Joe Garman Assistant Professor, Nursing & Human Science CL & NLP, speech recognition & signal processing
	Nazli Goharian Clinical Professor, CS information retrieval, text mining, biomedical/health informatics
	Triveni Guharoy MA in Language and Communication student, Linguistics speech recognition, phonology and phonotactics, sociolinguistics
	Zhuoxuan Ju MS student, Linguistics CL & NLP, L2 acquisition
	Hrishikesh Kulkarni Ph.D. student, CS information retrieval, deep reinforcement learning
	Lauren Levine Ph.D. student, Linguistics CL & NLP, corpus linguistics, multilingual HLT
	Yi-Ju Lin Ph.D. student, Linguistics CL & NLP, corpus linguistics
	Yaguang Liu Ph.D. student, CS deep learning, NLP, text mining
	Cole M. MA student, Security Studies computer vision, machine learning, AI in dynamic environments
	Rupayan Mallick Postdoctoral Fellow, CS deep learning, multimodal learning, explainable AI, vision and language
	Helge Marahrens Postdoctoral Fellow, Massive Data Institute NLP, predictive text mining, explainable AI, record linkage & fuzzy matching
	Matthew Marge Adjunct Lecturer / Program Manager at DARPA dialogue, situated interaction, natural language generation, machine learning
	Corey Miller Adjunct Lecturer / Researcher at Rev.com speech recognition, speech synthesis, speaker verification, sociolinguistics, dialectology, Persian
	Hyun Min Ph.D. student, Linguistics CL, human-like NLP, representations of structure in language
	Masato Nakano MS student, Linguistics LFG, low-resource languages, corpus linguistics
	Rich Pihlstrom BA student, CS & BA+MS student, Data Science and Analytics data science, urban analytics, NLP, machine learning
	Paul Portner Professor, Linguistics formal semantics, syntax/semantics interface, grammar formalisms, semantic representation, cognitive science
	Abhishek Purushothama Ph.D. student, CS CL & NLP, low-resource and multilingual NLP, programming languages
	Emma Rafkin MS student, Linguistics NLP, information extraction, low-resource languages
	Eliza Rice MS student, Linguistics CL & NLP, computational sociolinguistics
	Achim Ruopp Adjunct Lecturer / Owner at Polyglot Technology machine translation, multilingual NLP, evaluation
	Bradford Salen Ph.D. student, Linguistics computational approaches to second language processing, L1 acquisition, and psycholinguistics
	Wesley Scivetti Ph.D. student, Linguistics CL & NLP, computational semantics, low-resource NLP
	Nathan Schneider Associate Professor, Linguistics & CS CL & NLP, especially semantic representation, annotation, & analysis
	Ismail Shaheen Ph.D. student, CS multimodal learning, computer vision, explainable AI
	Lisa Singh Professor, CS & McCourt School of Public Policy social graph mining, text mining, data science, visual analytics
	Shabnam Tafreshi Adjunct Lecturer / NLP Researcher at eviCore Healthcare multilingual computational semantics, information extraction, annotation
	Rahul Gurram Thimmugari Ph.D. student, Neuroscience CL and cognitive/neuroscience
	Devika Tiwari Ph.D. student, Linguistics cognitive science and NLP, figurative language, discourse parsing
	Kevin Tobia Professor of Law law and language, CL & NLP
	Autumn Toney Ph.D. student, CS NLP, data mining, information retrieval
	Yanchen Wang Ph.D. student, CS ML fairness, NLP, deep learning, text mining
	Brandon Waldon Postdoctoral Fellow, Massive Data Institute & CS & Linguistics CL & NLP, cognitive science, law and language, semantics/pragmatics
	Ethan Wilcox Assistant Professor, Linguistics cognitive modeling, psycholinguistics, analysis and interpretation of LLMs, machine learning
	Jingni Wu MS student, Linguistics CL & NLP, computational semantics
	Grace Hui Yang Associate Professor, CS information retrieval, text mining, NLP, machine learning, privacy
	Xiulin Yang Ph.D. student, Linguistics neuro-symbolic NLP, meaning representation, compositional generalisation, coreference resolution
	Bailasan Zaina Ph.D. student, Arabic Linguistics syntax, NLP
	Amir Zeldes Associate Professor, Linguistics corpus building, search and visualization; coreference resolution; digital humanities
	Luopeng Zheng Ph.D. student, Linguistics machine learning, data science, NLP

	Julie Hockett Undergraduate, CS major/Linguistics minor →²⁰¹⁷ Google text mining, data science, NLP
	Angela Yang Undergraduate, CS major/Linguistics minor →²⁰¹⁷ Amazon information retrieval, dynamic search, signal processing
	Shuo Zhang Ph.D. Linguistics →²⁰¹⁷ Bose CL & NLP, coreference resolution, speech prosody, time-series data mining, music information retrieval
	Arman Cohan Ph.D. CS →²⁰¹⁸ Allen Institute for AI →²⁰²³ Yale NLP, information retrieval, medical text processing
	Jiyun Luo Ph.D. CS →²⁰¹⁸ Pinterest information retrieval, session search, dynamic search
	Dan Simonson Ph.D. Linguistics →²⁰¹⁸ BlackBoiler CL & NLP, narrative, coreference, critical discourse analysis, modality, using NLP for real-world problems
	Luca Soldaini Ph.D. CS →²⁰¹⁸ Amazon →²⁰²² Allen Institute for AI medical information retrieval
	Clarissa Somers *Undergraduate, Linguistics & CS →²⁰¹⁸ CiBO →²⁰¹⁹ MModal** CL & NLP
	Stacy Petersen Ph.D. Linguistics →²⁰¹⁸ MITRE NLP, big data extraction, phonetics/phonology, speech recognition & signal processing
	James Maguire MS Linguistics →²⁰¹⁹ ABAKA →²⁰²⁰ Adecco →²⁰²¹ Referment neural networks, computational & formal semantics, theory of computation
	Lucia Donatelli Ph.D. student, Spanish Linguistics →²⁰¹⁹ Saarland University →²⁰²³ Vrije Universiteit Amsterdam formal semantics, syntax/semantics interface, NLP
	Akitaka Yamada Ph.D. Linguistics →²⁰¹⁹ Surugadai University →²⁰²⁰ Osaka University corpus lingusitics, Bayesian stats, NLP, formal semantics
	Mitchell Abrams MS Linguistics →²⁰¹⁹ Army Research Lab →²⁰²¹ Tufts (Ph.D. CS) computational forensic linguistics, corpus linguistics, authorship attribution
	Sean Simpson Ph.D. Linguistics →²⁰¹⁹ Google CL & NLP, computational sociolinguistics
	Yue Yu MS CS →²⁰²⁰ Amazon NLP, reinforcement learning
	Trevor Adriaanse MS Linguistics →²⁰²¹ Department of Defense CL & NLP
	Sean MacAvaney Ph.D. CS →²⁰²¹ University of Glasgow information retrieval, NLP
	Sichang Tu MS Linguistics →²⁰²¹ Emory (Ph.D. CS) CL & NLP
	Eugene Yang Ph.D. CS →²⁰²¹ JHU unsupervised learning, NLP
	Tianjiao (Joey) Yu MS CS →²⁰²¹ Virginia Tech (Ph.D. CS) CL & NLP, syntax, semantics
	Austin Blodgett Ph.D. Linguistics →²⁰²¹ US Army Research Lab CL & NLP, computational semantics, mathematical approaches to linguistics
	Emma Manning Ph.D. Linguistics →²⁰²¹ Google →²⁰²⁴ Grid Dynamics CL & NLP
	Yifan Zhu MS Linguistics →²⁰²¹ Brandeis (Ph.D. CS) CL & NLP, syntax
	Ivy Wang BA CS & Linguistics →²⁰²¹ Amazon syntax-semantics, corpus linguistics, NLP
	Rob Churchill Ph.D. CS →²⁰²² 5-Out data mining, machine learning, text mining
	Ryan A. Mannion BA+MS Linguistics →²⁰²¹ BlackBoiler CL & NLP, syntax, morphology
	Jakob Prange Ph.D. CS →²⁰²² Hong Kong Polytechnic University →²⁰²³ University of Augsburg CL & NLP, semantics, syntax, representation design, parsing/structured prediction
	Jaren Haber Postdoctoral Fellow, MDI →²⁰²² Dartmouth NLP, word embeddings, topic models, sociology
	Kornraphop Kawintiranon Ph.D. CS →²⁰²² Google data mining, machine learning, NLP
	Yifu Mu BA CS & BA+MS student, Linguistics →²⁰²² Comcast NLP, language generation, MT
	Siyao (Logan) Peng Ph.D. Linguistics →²⁰²³ LMU Munich CL & NLP, syntax, language diversity
	Nitin Venkateswaran MS Linguistics →²⁰²³ University of Florida (Ph.D. Linguistics) syntax-semantics, corpus linguistics, MT
	Pamela Katali MS CS →²⁰²³ Dick's Sporting Goods NLP, machine learning, syntax
	Luke Gessler Ph.D. Linguistics →²⁰²³ University of Colorado Boulder →²⁰²⁴ Indiana University CL & NLP, computational methods in language documentation
	Wai Ching Leung MS Linguistics →²⁰²³ Comcast CL & NLP
	Ulie Xu BA+MS, Linguistics →²⁰²³ Comcast CL & NLP, syntax, conversational AI chatbots
	Aryaman Arora BS CS & BA Linguistics →²⁰²³ Stanford (Ph.D. CS) CL & NLP, South Asian linguistics, meaning representation, phonology
	Karen McNeil Ph.D. Arabic Linguistics →²⁰²³ Innodata NLP, sociolinguistics
	Yilun Zhu Ph.D. Linguistics →²⁰²⁴ Staples →²⁰²⁵ Amazon CL & NLP, coreference resolution, corpus linguistics
	Tom Lupicki Undergraduate, CS major/Linguistics minor →²⁰²⁴ Johns Hopkins (M.S. CS) NLP, CL, machine learning, syntax
	Yang Janet Liu Ph.D. Linguistics →²⁰²⁴ LMU Munich CL & NLP, discourse structure
	Sajad Sotudeh Ph.D. CS →²⁰²⁴ Comcast NLP, information retrieval, medical and scientific text processing
	Shira Wein Ph.D. CS →²⁰²⁴ Amherst College CL & NLP
	Jessica Cusi MS Linguistics →²⁰²⁴ Five9 NLP, corpus linguistics, sociolinguistics
	Caroline Gish MS Linguistics →²⁰²⁴ NobleReach Scholars Program CL & NLP, computational semantics
	Cindy Li MS Linguistics →²⁰²⁴ Capitol One CL, low-resource languages, language documentation
	Michael Kranzlein Ph.D. CS (2024) →²⁰²⁵ Signify CL & NLP, machine learning, data science
	Shabnam Behzad Ph.D. CS →²⁰²⁴ Reka AI NLP, grammatical error correction, data augmentation

GUCL: Computational Linguistics @ Georgetown

upcoming talks/events

People

Alumni