Mänsklig bildsyntes

Mänsklig bildsyntes (human image synthesis) är en process genom vilken en bild av ett verkligt eller fiktivt objekt eller miljö skapas genom datorer. Mänsklig bildsyntes kan användas inom en mängd olika områden, inklusive film, datorspel, arkitektur, industridesign och medicin.[1]

Det finns olika metoder för att generera bilder med hjälp av datorer, inklusive strålföljning, radiosity och rasterisering. Ray tracing använder sig av strålar för att simulera hur ljuset beter sig i en scen, medan radiosity simulerar hur ljuset fördelar sig i en miljö. Rasterisering använder sig av pixlar för att skapa en bild på en skärm.[2]

Mänsklig bildsyntes kan också användas för att skapa realistiska avbildningar av fysiska miljöer och objekt, såsom landskap, hus och möbler. Detta kan användas inom arkitektur och industridesign för att skapa visualiseringar av hur ett projekt kan komma att se ut i verkligheten.

Inom medicin kan mänsklig bildsyntes användas för att skapa avbildningar av kroppens inre för diagnostiska ändamål med hjälp av verktyg som CT- och MR-skannrar. Detta kan hjälpa läkare att få en bättre förståelse för patientens hälsotillstånd och välja rätt behandling.[3][4]

Mänsklig bildsyntes har även använts inom filmindustrin för att skapa specialeffekter och animationer. Detta kan inkludera allt ifrån att lägga till effekter till redan existerande filmer till att skapa hela fiktiva världar och karaktärer.[5]

Tidslinje

  • 1971. Henri Gouraud skapar den första representationen av ett mänskligt ansikte genom scanning, med sin fru Sylvie Gouraud som modell.
  • 1994. Filmen The Crow blir den första film vars produktion använde sig av digital sammansättning av en datorsimulerad representation av ett ansikte på scener filmade med en kroppsdubbel. Nödvändigheten var musan när skådespelaren Brandon Lee som porträtterade huvudpersonen dödades tragiskt av misstag på scenen.
  • 2015. För filmen Fast & Furious 7 görs en digital look-alike av skådespelaren Paul Walker som dog i en olycka under inspelningen av Weta Digital för att göra filmen färdig.
  • 2019. I september detta år sände den finska public service-verksamheten Yle en deepfake av presidenten Sauli Niinistö i syfte att belysa den framskridande desinformationsteknologin och de problemen denna kan komma att ge upphov till.

Referenser

Den här artikeln är helt eller delvis baserad på material från engelskspråkiga Wikipedia, Human image synthesis, 27 december 2021.

Noter

  1. ^ ”Synthesis AI can programmatically generate synthetic images of humans for AI training” (på amerikansk engelska). SiliconANGLE. 1 november 2022. https://siliconangle.com/2022/11/01/synthesis-ai-can-programmatically-generate-synthetic-images-humans-ai-training/. Läst 3 januari 2023. 
  2. ^ Synced (20 november 2020). ”Impersonator++ Human Image Synthesis – Smarten Up Your Dance Moves! | Synced” (på amerikansk engelska). syncedreview.com. https://syncedreview.com/2020/11/20/impersonator-human-image-synthesis-smarten-up-your-dance-moves/. Läst 3 januari 2023. 
  3. ^ Wang, Tonghe; Lei, Yang; Fu, Yabo; Wynne, Jacob F.; Curran, Walter J.; Liu, Tian (2021-01). ”A review on medical imaging synthesis using deep learning and its clinical applications” (på engelska). Journal of Applied Clinical Medical Physics 22 (1): sid. 11–36. doi:10.1002/acm2.13121. ISSN 1526-9914. PMID 33305538. PMC: PMC7856512. https://onlinelibrary.wiley.com/doi/10.1002/acm2.13121. Läst 3 januari 2023. 
  4. ^ Park, Ho Young; Bae, Hyun-Jin; Hong, Gil-Sun; Kim, Minjee; Yun, JiHye; Park, Sungwon (2021-03-17). ”Realistic High-Resolution Body Computed Tomography Image Synthesis by Using Progressive Growing Generative Adversarial Network: Visual Turing Test” (på engelska). JMIR Medical Informatics 9 (3): sid. e23328. doi:10.2196/23328. https://medinform.jmir.org/2021/3/e23328. Läst 3 januari 2023. 
  5. ^ Ming-Yu Liu*, Xun Huang*, Jiahui Yu*, Ting-Chun Wang*, Arun Mallya*. [https://arxiv.org/pdf/2008.02793.pdf ”Generative Adversarial Networks for Image and Video Synthesis: Algorithms and Applications”]. https://arxiv.org/pdf/2008.02793.pdf. Läst 3 januari 2023. 
v  r
Differentierbar datoranvändning
General
Differentierbar programmering Neural Turing maskin Differentierbar neural dator Automatisk differentiering Neuromorf ingenjörskonst Cable theory Mönsterigenkänning Beräkningslärandeteori Tensorkalkyl
Begrepp
Gradient descent SGD Klusteranalys Regression Overfitting Adversary Attention Faltning Förlustfunktioner Backpropagation Normalization Activation Softmax Sigmoid Rectifier Regularization Datasets Augmentation
Programmeringsspråk
Python Julia
Applikationer
Hårdvara
IPU TPU VPU Memristor SpiNNaker
Mjukvarubibliotek
TensorFlow PyTorch Keras Theano
Implementation
Audiovisuellt
AlexNet WaveNet Mänsklig bildsyntes Handskriftsigenkänning Maskinläsning Talsyntes Taligenkänning Ansiktsigenkänning AlphaFold DALL-E
Verbal
Word2vec Transformator BERT NMT Project Debater Watson GPT-2 GPT-3
Beslutande
Alphago AlphaZero Q-learning SARSA OpenAI Five Självkörande bil MuZero Action selection Robot control
Personer
Alex Graves Ian Goodfellow Yoshua Bengio Geoffrey Hinton Yann LeCun Andrew Ng Demis Hassabis David Silver Fei-Fei Li
Organisationer
Deepmind Hi! PARIS Openai MIT CSAIL Mila Google Brain