Profile avatar
aurelien-goutsmedt.com
Post-doc @UC Louvain https://aurelien-goutsmedt.com History macro, inflation, econ policy & energy since the 70s #Political_Economy #Central_Banks #Rstats #nlp #networks #bibliometrics Managing editor journals.openedition.org/oeconomia
76 posts 2,325 followers 2,229 following
Prolific Poster
Conversation Starter
comment in response to post
La première place de Paris 1 demeure inchangée même quand on étend les données historiquement (mais pour l'économie uniquement). Cf la figure 5 : tdelcey.github.io/becoming_eco...
comment in response to post
3/ The answer? Yes—overwhelmingly so. It’s by far the strongest predictor. Agency size didn’t matter—larger agencies aren't more likely to be facing firings/layoffs. Bigger budgets made firings/layoffs slightly more likely but the effect was modest.
comment in response to post
carbon shock therapy hitting German manufacturing more than a global pandemic that kept us at home for months.
comment in response to post
www.eshet-conference.net/torino/ed202...
comment in response to post
You can explore part of the database here: tdelcey.github.io/becoming_eco... And the full documentation on the construction of the database is here: tdelcey.github.io/becoming_eco...
comment in response to post
D'ailleurs, merci beaucoup au Ministère de la Culture pour cette chouette base, mais par pitié proposez des dumps. J'adore le scraping mais j'ai une thèse à finir ! Les données sont là : huggingface.co/datasets/reg... Téléchargement direct : huggingface.co/datasets/reg... (169Mb)
comment in response to post
Et utiliser une méthode de clustering sur les embeddings ? On pourrait tester ça oui, même si j'aime bien le "mixed-membership" du topic modeling. Mais d'expérience j'ai été un peu déçu par BERT pour des corpus spécialisés.
comment in response to post
Merci pour le partage. Promotion éhontée : avec @alxndrtrc.bsky.social on avait utilisé méthodes et corpus similaires pour tester les particularités de la macro en Europe par rapport aux travaux US: www.sciencedirect.com/science/arti...
comment in response to post
But not necessarily all the words or even one of them (may be these dissertations use the 6th or 7th word associated to the topic). In short, it's a finer measure than just counting for the presence of these words
comment in response to post
Neither, actually. The curve represents the prevalence of a certain topic. This topic can be described by this 5 words (they are the 5 words the most representative of this topic). So dissertations highly associated with this topic likely use some of these words (in their title)
comment in response to post
En effet le problème ici est qu'il n'y a que très peu d'info dans les titres. Mais du côté des gros modèles d'embedding, faut faire de l'adaptation au domaine spécifique de l'économie (surtout depuis 1900), et c'est coûteux computationellement (surtout pour un post de blog ;))