Хз, выглядит как машинное обучение (intent recognition + voice to text), для этого даже своего ничего писать не нужно, на huggingface поищи готовые модельки, конечно возможно придется немножко fine tune прогнать
если нужно в андроид, то это kotlin
если нужно создание и заполнение таблиц, то тут тоже библиотеки готовые есть, если хочешь именно сам, то любой MS продукт (word, excel итд), это архив, можешь поменять расширение .docx, на .zip, открыть его и посмотреть что внутри, там уже по документации сможешь понять какой файлик за что отвечает (если офк есть желание с этим копаться, я копался, приходилось, никому не советую)
в общем 100% все уже готовое есть для этого